Hitech logo

искусственный интеллект

Новая языковая модель Anthropic показала «почти человеческие» возможности

TODO:
Георгий Голованов5 марта, 09:58

Один из главных конкурентов OpenAI выпустил семейство языковых моделей Claude 3. Стартап Anthropic утверждает, что они станут новым стандартом качества для индустрии ИИ по ряду когнитивных задач, а в некоторых случаях даже приближаются к «почти человеческим» возможностям. Самая мощная из трех моделей доступна только по подписке, остальные — для всех.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Все три модели стартапа Anthropic — Claude 3 Haiku, Claude 3 Sonnet и Claude 3 Opus — демонстрируют прогресс в анализе и прогнозировании, а также лучшие отметки в тестах на производительность по сравнению с ChatGPT или Gemini 1.0 Ultra. У всех трех контекстное окно на 200 000 токенов (столько частей слов ИИ может обработать за раз), сообщает Ars Technica.

Когда Anthropic выпустила Claude и Claude 2 в марте и июле прошлого года, они отставали от лучших моделей OpenAI в производительности, хотя превосходили их в величине контекстного окна. Claude 3, наконец, нагнала лидера, хотя единодушного мнения по этому вопросу среди экспертов нет. Все зависит от того, какой именно показатель считать самым важным.

Как бы то ни было, Claude 3 продемонстрировал успехи в различных когнитивных тестах на логику, экспертное знание и владение языком. По утверждению компании, модель Opus, самая мощная из трех, проявляет «почти человеческий уровень понимания и беглости в решении комплексных задач».

Это не означает, впрочем, что Claude 3 Opus достигла уровня универсального искусственного интеллекта или чего-то в этом роде. Но победа над GPT-4 в десяти тестах, включая MMLU (знания уровня неполного высшего образования), GSM8K (математика школьного уровня), HumanEval (программирование) и HellaSwag (общая эрудиция), несомненно, значимое достижение.

В некоторых случаях разница в набранных очках минимальная (Opus обошел лидера на 0,4% в MMLU), в других — существенная: в HumanEval он набрал 90,7%, тогда как у GPT-4 было 67%.

Такого прироста производительности Claude 3 добилась отчасти благодаря использованию в процессе обучения искусственных данных, таких, которые были сгенерированы при помощи другой языковой модели ИИ.

По сравнению со своими предшественниками, Claude 3 стала быстрее и экономичнее: Opus, самая большая модель, тратит $15 на один миллион входящих токенов, и $75 — на миллион исходящих. У самой маленькой и быстрой Haiku — $0,25 за миллион входящих и $1,25 за миллион исходящих токенов. Стоимость входящих токенов GPT-4 Turbo через API, к примеру, равна $10, исходящих — $30.

В январе 2024-го OpenAI обновила модели GPT-3.5 Turbo и GPT-4 Turbo, представила новые инструменты управления использованием API, а также снизила цены. Обновленные GPT Turbo лучше выполняют инструкции, обладают режимом JSON и «более воспроизводимыми» выходными данными, а также эффективно обрабатывают несколько запросов одновременно.