Anthropic называет Claude 3.7 Sonnet первой в своём роде «гибридной моделью ИИ с функцией рассуждения», так как она может отвечать на вопросы как мгновенно, так и после более глубокого анализа. Пользователи могут выбирать, использовать ли режим «рассуждения», который позволяет модели «думать» дольше. Anthropic хочет максимально упростить взаимодействие пользователей с ИИ-продуктами. В отличие от многих чат-ботов, которые предлагают сложный выбор моделей с разной стоимостью и функциями (как, например, у OpenAI), Claude 3.7 Sonnet универсальна. Компания считает, что пользователям не нужно выбирать между моделями — идеальное решение заключается в единой системе, которая подходит для всего.
Claude 3.7 Sonnet — первая модель ИИ от Anthropic, которая умеет «думать». Многие компании используют этот подход, так как традиционные методы улучшения работы ИИ становятся менее эффективными. Модели, способные к рассуждению, такие как o3-mini, R1, Gemini 2.0 Flash Thinking и Grok 3 (Think), тратят больше времени и ресурсов, чтобы дать ответ. Они разбивают задачи на более мелкие части, что обычно делает ответ более точным. Конечно, это не совсем то же самое, что человеческое мышление, но в основе этого процесса лежит логика.
В будущем Anthropic хочет, чтобы Claude сам решал, сколько ему нужно «думать» над вопросами, без участия пользователя.
Anthropic добавила в Claude 3.7 Sonnet функцию «видимого черновика», позволяющую пользователям следить за процессом «мышления» модели. Хотя большая часть информации будет открыта, некоторые детали скроют. Anthropic оптимизировала Claude для сложных задач, таких как программирование. Разработчики, использующие API, могут настраивать время, выделяемое на «мышление», чтобы найти баланс между скоростью, ценой и качеством ответа.
На тестовой платформе SWE-Bench, оценивающей навыки программирования в реальных условиях, Claude 3.7 Sonnet показал результат 62,3%, тогда как o3-mini от OpenAI набрал 49,3%. В другом тесте, TAU-Bench, имитирующем взаимодействие с пользователями и API в розничной торговле, Claude 3.7 Sonnet достиг 81,2%, а o1 от OpenAI — 73,5%. Модель лучше различает вредные и безопасные запросы и реже отказывается отвечать на вопросы. Количество отказов снижено на 45% по сравнению с Claude 3.5 Sonnet.
Anthropic запускает Claude 3.7 Sonnet для всех пользователей и разработчиков, но доступ к функциям «рассуждения» будет только у платных подписчиков. Бесплатные пользователи получат стандартную версию, которая, по словам Anthropic, лучше предшественника Claude 3.5 Sonnet. Claude 3.7 Sonnet стоит $3 за 1 млн входных токенов или около 750 000 слов (больше, чем вся серия «Властелин колец») и $15 за 1 млн выходных токенов. Это дороже, чем o3-mini от OpenAI и R1 от DeepSeek, но важно помнить, что они предназначены только для рассуждения, а Claude 3.7 Sonnet — гибридная модель.
Anthropic также представила Claude Code — ИИ-агент для программирования, доступный в режиме исследовательского превью. Он позволяет разработчикам выполнять задачи через Claude прямо из терминала.
В демонстрации сотрудники компании показали, как с помощью простой команды, например «Объясни структуру проекта», Claude Code анализирует код, вносит изменения, тестирует и загружает проект на GitHub. На первом этапе доступ к инструменту получит ограниченное число пользователей.
Между тем, Anthropic привлекла $3,5 млрд инвестиций, в результате чего оценка компании достигла $61,5 млрд. Инвесторы согласились увеличить первоначальную сумму в $2 млрд. По данным WSJ, компания получает $1,2 млрд годового дохода, но пока работает в убыток. Anthropic направит инвестиции на развитие новых технологий ИИ.