Дешевые ИИ-модели могут достигать таких же результатов, что и Claude Mythos

Кейсы

Екатерина Шемякинская15 апреля, 14:32

Екатерина Шемякинская15 апреля, 14:32

Недавний анонс модели Claude Mythos от Anthropic и запуск консорциума Project Glasswing наделали много шума в индустрии. Разработчики заявили, что их новая закрытая модель обладает уникальной способностью находить уязвимости, которые оставались незамеченными десятилетиями. Однако исследование компании AISLE ставит под сомнение эти достижения. Эксперты доказали, что даже небольшие и дешевые модели с открытым исходным кодом способны воспроизвести сложный анализ Mythos, если они встроены в правильно спроектированную систему.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Исследователи протестировали сценарии Anthropic на компактных моделях. Результаты оказались поразительными: 8 из 8 протестированных нейросетей, включая миниатюрную модель с 3,6 млрд параметров (стоимостью всего $0,11 за миллион токенов), успешно обнаружили критическую уязвимость в ядре FreeBSD. Другая открытая модель восстановила сложную цепочку анализа 27-летней ошибки в OpenBSD. Это доказывает, что возможности ИИ в сфере информационной безопасности не растут плавно с размером модели, а распределены крайне неравномерно.

Китай стал второй страной в мире, успешно вернувшей первую ступень ракеты-носителя

Одним из наиболее показательных тестов стал «парадокс OWASP». Исследователи предложили моделям фрагмент кода на Java, который выглядит как уязвимость, но на деле безопасен. Большинство «гигантов», включая Claude 4.5 и GPT-4, ошиблись, выдав ложноположительный результат. В то же время небольшие открытые модели, такие как DeepSeek R1, корректно отследили логику и подтвердили безопасность кода.

Разрыв между возможностями моделей особенно заметен при переходе от обнаружения к эксплуатации. В то время как Mythos демонстрирует виртуозное создание сложных эксплойтов, открытые модели предлагают более прагматичные, хоть и менее «творческие» инженерные решения. Однако для задач защиты — поиска и устранения уязвимостей — «гениальность» в написании вирусов нужна гораздо реже, чем надёжное и недорогое сканирование.

Данные AISLE, накопленные с середины 2025 года, показывают, что открытые системы уже сегодня находят критические уязвимости в таких проектах, как OpenSSL и curl, и получают одобрение от их технических руководителей. Это реальная работа в производственной среде, которая ведётся независимо от закрытых лабораторий.

Главный вывод исследования: в кибербезопасности ИИ ключевое значение имеет система, а не конкретная модель. Интеллект нейросети — лишь один из параметров. Эффективность защиты зависит от того, как организован процесс: от глубокой экспертизы, заложенной в архитектуру, до итеративной проверки гипотез. Успех Anthropic подтверждает жизнеспособность ИИ-анализа, но не доказывает необходимость использования исключительно дорогих проприетарных систем.

Для индустрии это означает смену парадигмы. Вместо опоры на одну дорогую и мощную модель становится эффективнее использовать множество более дешёвых моделей, которые могут параллельно анализировать большие объёмы кода.

Также по теме

Кейсы

Манго Страхование запускает иншуринг драгоценностей

Кейсы

Стартап Promin Aerospace получил $500 тыс. инвестиций от венчурного фонда QPDigital

Кейсы

Армия США получила лазеры мощностью 20 кВт для борьбы с воздушными целями

Кейсы

BYD собирается построить еще одну огромную фабрику за рубежом

Новости СМИ2