Hitech logo

Кейсы

Дешевые ИИ-модели могут достигать таких же результатов, что и Claude Mythos

TODO:
Екатерина ШемякинскаяСегодня, 02:32 PM

Недавний анонс модели Claude Mythos от Anthropic и запуск консорциума Project Glasswing наделали много шума в индустрии. Разработчики заявили, что их новая закрытая модель обладает уникальной способностью находить уязвимости, которые оставались незамеченными десятилетиями. Однако исследование компании AISLE ставит под сомнение эти достижения. Эксперты доказали, что даже небольшие и дешевые модели с открытым исходным кодом способны воспроизвести сложный анализ Mythos, если они встроены в правильно спроектированную систему.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Исследователи протестировали сценарии Anthropic на компактных моделях. Результаты оказались поразительными: 8 из 8 протестированных нейросетей, включая миниатюрную модель с 3,6 млрд параметров (стоимостью всего $0,11 за миллион токенов), успешно обнаружили критическую уязвимость в ядре FreeBSD. Другая открытая модель восстановила сложную цепочку анализа 27-летней ошибки в OpenBSD. Это доказывает, что возможности ИИ в сфере информационной безопасности не растут плавно с размером модели, а распределены крайне неравномерно.

Одним из наиболее показательных тестов стал «парадокс OWASP». Исследователи предложили моделям фрагмент кода на Java, который выглядит как уязвимость, но на деле безопасен. Большинство «гигантов», включая Claude 4.5 и GPT-4, ошиблись, выдав ложноположительный результат. В то же время небольшие открытые модели, такие как DeepSeek R1, корректно отследили логику и подтвердили безопасность кода.

Разрыв между возможностями моделей особенно заметен при переходе от обнаружения к эксплуатации. В то время как Mythos демонстрирует виртуозное создание сложных эксплойтов, открытые модели предлагают более прагматичные, хоть и менее «творческие» инженерные решения. Однако для задач защиты — поиска и устранения уязвимостей — «гениальность» в написании вирусов нужна гораздо реже, чем надёжное и недорогое сканирование.

Данные AISLE, накопленные с середины 2025 года, показывают, что открытые системы уже сегодня находят критические уязвимости в таких проектах, как OpenSSL и curl, и получают одобрение от их технических руководителей. Это реальная работа в производственной среде, которая ведётся независимо от закрытых лабораторий.

Главный вывод исследования: в кибербезопасности ИИ ключевое значение имеет система, а не конкретная модель. Интеллект нейросети — лишь один из параметров. Эффективность защиты зависит от того, как организован процесс: от глубокой экспертизы, заложенной в архитектуру, до итеративной проверки гипотез. Успех Anthropic подтверждает жизнеспособность ИИ-анализа, но не доказывает необходимость использования исключительно дорогих проприетарных систем.

Для индустрии это означает смену парадигмы. Вместо опоры на одну дорогую и мощную модель становится эффективнее использовать множество более дешёвых моделей, которые могут параллельно анализировать большие объёмы кода.