Hitech logo

Кейсы

Anthropic выпустила Claude Sonnet 4.6 с контекстным окном в 1 млн токенов

TODO:
Екатерина ШемякинскаяСегодня, 12:29 PM

Компания представила Claude Sonnet 4.6 — обновленную модель среднего размера, которая стала основной для пользователей бесплатного и платного тарифов. Главным новшеством стало контекстное окно в 1 млн токенов — вдвое больше, чем у предыдущей версии. Теперь можно обрабатывать целые кодовые базы и длинные документы в одном запросе. Модель также получила улучшения в программировании, работе с компьютером и, по словам первых пользователей, реже галлюцинирует и лучше соблюдает инструкции.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Релиз состоялся всего через несколько недель после запуска компанией флагманской модели Opus 4.6. Sonnet 4.6 получила контекстное окно в 1 млн токенов. По словам Anthropic, этого достаточно для хранения целых кодовых баз, длинных контрактов или десятков научных работ в одном запросе, что открывает возможности для сложных задач и долгосрочного планирования.

Модель демонстрирует рекордные показатели в бенчмарках, включая OS World для оценки работы с компьютером и SWE-Bench для навыков программирования. В тесте ARC-AGI-2, измеряющем способности, сопоставимые с человеческим интеллектом, Sonnet 4.6 набрала 60,4%, что выше большинства моделей Sonnet, но немного уступает Opus 4.6, Gemini 3 Deep Think и усовершенствованным версиям GPT 5.2.

В своем блоге Anthropic отмечает, что Sonnet 4.6 улучшила навыки программирования и взаимодействия с инструкциями. Пользователи раннего доступа предпочитали новую версию предыдущей в 70% случаев, а порой и экспериментальной Opus 4.5.

Производительность, ранее доступная только для моделей Opus, теперь доступна более широкой аудитории.

Важной особенностью Sonnet 4.6 стало использование компьютера без необходимости специальных API или коннекторов. Модель может работать с обычными приложениями, включая браузеры, офисные программы и редакторы кода, кликая мышью и вводя текст так же, как человек. OSWorld подтверждает улучшение возможностей Sonnet за последние 16 месяцев. Первые пользователи отмечают, что модель хорошо работает со сложными электронными таблицами и многоэтапными веб-формами.

Такая «самостоятельность» сопряжена с рисками, поэтому Anthropic уделила внимание безопасности. Компания работает над тем, чтобы снижать вероятность выполнения ИИ вредоносных или нежелательных действий, противоречащих политике или корпоративным требованиям. Sonnet 4.6 демонстрирует «в целом теплый, честный и просоциальный характер».

Пользователи отмечают, что Sonnet 4.6 реже галлюцинирует, лучше соблюдает инструкции и эффективнее объединяет контекст, чем предыдущие версии. Улучшения особенно заметны во фронтенд-коде, финансовом анализе и управлении многозадачными процессами, а визуальные результаты стали более качественными и продуманными.

Кроме того, Sonnet 4.6 демонстрирует стратегическое мышление в имитации бизнес-процессов: сначала инвестирует в наращивание мощностей, затем фокусируется на прибыльности. Такой подход позволил ей опередить конкурентов на арене Vending-Bench Arena. Пользователи получают более проработанные решения, пригодные для промышленного использования, с меньшим числом итераций.

Для пользователей бесплатного и платного тарифов Sonnet 4.6 теперь установлена в качестве модели по умолчанию на платформах Claude.ai и Claude Cowork. Стоимость осталась прежней по сравнению с Sonnet 4.5 — от $3 за миллион входных токенов и $15 за миллион выходных. Кроме того, Anthropic расширила возможности бесплатного плана, добавив функции создания файлов, коннекторы, навыки и сжатие контекста, которые раньше были доступны только подписчикам платных тарифов.