Anthropic выпустила первую гибридную ИИ-модель с рассуждением

Кейсы

Екатерина Шемякинская25 февраля, 08:03

Екатерина Шемякинская25 февраля, 08:03

Anthropic представила Claude 3.7 Sonnet — первую гибридную ИИ-модель с функцией рассуждения. Она может отвечать мгновенно или анализировать запрос глубже — все зависит от желания пользователя. Claude 3.7 Sonnet превосходит конкурентов, например, o3-mini, в тестах на программирование и взаимодействие с API. Модель доступна всем пользователям, но функции рассуждения открыты только для платных подписчиков. Одновременно с релизом компания привлекла $3,5 млрд инвестиций, увеличив свою оценку до $61,5 млрд.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Anthropic называет Claude 3.7 Sonnet первой в своём роде «гибридной моделью ИИ с функцией рассуждения», так как она может отвечать на вопросы как мгновенно, так и после более глубокого анализа. Пользователи могут выбирать, использовать ли режим «рассуждения», который позволяет модели «думать» дольше. Anthropic хочет максимально упростить взаимодействие пользователей с ИИ-продуктами. В отличие от многих чат-ботов, которые предлагают сложный выбор моделей с разной стоимостью и функциями (как, например, у OpenAI), Claude 3.7 Sonnet универсальна. Компания считает, что пользователям не нужно выбирать между моделями — идеальное решение заключается в единой системе, которая подходит для всего.

Американский ученый-иммунолог Дерья Унутмаз просит не умирать в ближайшие десять лет

Claude 3.7 Sonnet — первая модель ИИ от Anthropic, которая умеет «думать». Многие компании используют этот подход, так как традиционные методы улучшения работы ИИ становятся менее эффективными. Модели, способные к рассуждению, такие как o3-mini, R1, Gemini 2.0 Flash Thinking и Grok 3 (Think), тратят больше времени и ресурсов, чтобы дать ответ. Они разбивают задачи на более мелкие части, что обычно делает ответ более точным. Конечно, это не совсем то же самое, что человеческое мышление, но в основе этого процесса лежит логика.

В будущем Anthropic хочет, чтобы Claude сам решал, сколько ему нужно «думать» над вопросами, без участия пользователя.

Anthropic добавила в Claude 3.7 Sonnet функцию «видимого черновика», позволяющую пользователям следить за процессом «мышления» модели. Хотя большая часть информации будет открыта, некоторые детали скроют. Anthropic оптимизировала Claude для сложных задач, таких как программирование. Разработчики, использующие API, могут настраивать время, выделяемое на «мышление», чтобы найти баланс между скоростью, ценой и качеством ответа.

На тестовой платформе SWE-Bench, оценивающей навыки программирования в реальных условиях, Claude 3.7 Sonnet показал результат 62,3%, тогда как o3-mini от OpenAI набрал 49,3%. В другом тесте, TAU-Bench, имитирующем взаимодействие с пользователями и API в розничной торговле, Claude 3.7 Sonnet достиг 81,2%, а o1 от OpenAI — 73,5%. Модель лучше различает вредные и безопасные запросы и реже отказывается отвечать на вопросы. Количество отказов снижено на 45% по сравнению с Claude 3.5 Sonnet.

Anthropic запускает Claude 3.7 Sonnet для всех пользователей и разработчиков, но доступ к функциям «рассуждения» будет только у платных подписчиков. Бесплатные пользователи получат стандартную версию, которая, по словам Anthropic, лучше предшественника Claude 3.5 Sonnet. Claude 3.7 Sonnet стоит $3 за 1 млн входных токенов или около 750 000 слов (больше, чем вся серия «Властелин колец») и $15 за 1 млн выходных токенов. Это дороже, чем o3-mini от OpenAI и R1 от DeepSeek, но важно помнить, что они предназначены только для рассуждения, а Claude 3.7 Sonnet — гибридная модель.

Anthropic также представила Claude Code — ИИ-агент для программирования, доступный в режиме исследовательского превью. Он позволяет разработчикам выполнять задачи через Claude прямо из терминала.

В демонстрации сотрудники компании показали, как с помощью простой команды, например «Объясни структуру проекта», Claude Code анализирует код, вносит изменения, тестирует и загружает проект на GitHub. На первом этапе доступ к инструменту получит ограниченное число пользователей.

Между тем, Anthropic привлекла $3,5 млрд инвестиций, в результате чего оценка компании достигла $61,5 млрд. Инвесторы согласились увеличить первоначальную сумму в $2 млрд. По данным WSJ, компания получает $1,2 млрд годового дохода, но пока работает в убыток. Anthropic направит инвестиции на развитие новых технологий ИИ.

Также по теме

Кейсы

Tesla внедряет суперкомпьютер на 10 тыс. ускорителей NVIDIA H100 для обучения автопилота

Кейсы

Седан Lucid Air уверенно побил Tesla Model S в драг-рейсинге

Кейсы

Китайский робот-андроид освоил ступени

Кейсы

Новый Орлеан объявил чрезвычайное положение из-за хакерских атак

Новости СМИ2