Hitech logo

Кейсы

Anthropic представила Claude Opus 4.8 — модель «честнее» и меньше ошибается

TODO:
Екатерина ШемякинскаяСегодня, 10:33 AM

Anthropic представила обновление флагманской модели Claude Opus 4.8. Главные улучшения — в агентных задачах: модель стала точнее, в четыре раза реже оставляет ошибки в коде и чаще признаёт, что не уверена в ответе. Пользователи claude.ai могут выбирать «уровень усилий» — от быстрых ответов до глубокого анализа. Новый ускоренный режим API работает в 2,5 раза быстрее предыдущих быстрых версий. При этих улучшениях цены остались прежними.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Claude  Opus 4.8 стала «более надёжным и точным партнёром для совместной работы» при выполнении агентных задач. Модель хорошо справляется с долгими рабочими процессами, реже теряет контекст и чаще замечает ошибки в коде. По внутренним оценкам компании, количество подобных ошибок сократилось в четыре раза по сравнению с Opus 4.7.

Разработчики и первые тестировщики также отметили рост «честности» модели. В Anthropic объясняют, что многие ИИ-системы склонны уверенно делать выводы даже при недостатке данных. Claude Opus 4.8, напротив, чаще указывает на неопределённость и избегает неподтверждённых утверждений. В компании заявили, что новая версия показала более низкий уровень нежелательного поведения, включая попытки обмана или некорректного выполнения инструкций.

Вместе с моделью компания запустила функцию Dynamic Workflows для Claude Code, которая позволяет ИИ самостоятельно разбивать масштабные задачи на множество параллельных подзадач и запускать сотни вспомогательных агентов в рамках одной сессии. Система уже способна проводить миграции крупных кодовых баз объёмом в сотни тысяч строк кода практически без участия человека — от анализа до финального тестирования и объединения изменений.

Кроме того, пользователи claude.ai получили новую настройку «уровня усилий» — теперь можно выбирать, сколько вычислительных ресурсов модель будет тратить на ответ. При высоких настройках Claude дольше анализирует задачу и выдаёт более качественные результаты, а при низких — отвечает быстрее и экономнее расходует лимиты токенов. Функция доступна во всех тарифных планах.

Anthropic также обновила API: разработчики смогут изменять системные инструкции прямо в процессе работы агента без сброса контекста. Это позволяет регулировать ограничения, бюджеты токенов и параметры среды во время выполнения сложных задач. Такая возможность особенно важна для корпоративных и инженерных сценариев использования ИИ.

Claude Opus 4.8 уже доступен через Claude API и сервис claude.ai. Стоимость стандартного режима осталась прежней — $5 за миллион входных токенов и $25 за миллион выходных.

Также компания представила ускоренный режим работы модели: он обеспечивает производительность в 2,5 раза выше и при этом стал втрое дешевле по сравнению с предыдущими быстрыми версиями Claude.

Как отмечает Anthropic, Claude Opus 4.8 представляет собой «скромное, но ощутимое» улучшение по сравнению с предыдущим поколением. Однако компания уже работает над новым классом моделей с ещё более высоким уровнем интеллекта. В рамках проекта Glasswing ограниченному числу организаций уже доступна мощная экспериментальная модель Claude Mythos Preview, предназначенная для задач в области кибербезопасности.