Hitech logo

Тренды

Новая китайская модель Kimi K2 превзошла в тестах лучшие модели от OpenAI и Anthropic

TODO:
Елена ВерещагинаСегодня, 02:29 PM

Китайский стартап Moonshot AI представил свою новую открытую модель Kimi K2 Thinking с 1 триллионом параметров, заявив, что она превосходит GPT-5 от OpenAI, Claude Sonnet 4.5 от Anthropic и предыдущего лидера среди открытых моделей MiniMax-M2 по множеству показателей в области логических рассуждений, программирования и задач автономных агентов.​ При этом затраты на ее обучение, по данным CNBC, составили всего $4,6 млн. Это на два порядка меньше, чем тратят на обучение своих передовых моделей OpenAI и Anthropic.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Kimi K2 Thinking достиг 44,9% в тесте Humanity’s Last Exam — передовом бенчмарке из 2500 проверенных экспертами вопросов, разработанном так, чтобы оставаться сложным по мере развития ИИ. Модель набрала 60,2% в BrowseComp — бенчмарке веб-исследований, где GPT-5 достиг 54,9%, а Claude Sonnet 4.5 — 24,1%. В SWE-Bench Verified, который тестирует решение реальных задач программной инженерии, K2 Thinking набрал 71,3%.​

Согласно независимой оценочной фирме Artificial Analysis, K2 Thinking достиг высшего результата в агентском бенчмарке Tau2 Bench Telecom, который измеряет производительность ИИ в сценариях обслуживания клиентов, требующих использования инструментов. Модель способна автономно выполнять 200-300 последовательных вызовов инструментов, поддерживая логичное рассуждение на протяжении сотен шагов без вмешательства человека.​

Moonshot AI указывает цены API K2 Thinking на уровне $0,15 за миллион токенов для кэшированного ввода, $0,60 за миллион для промахов кэша и $2,50 за миллион для вывода. Это сравнимо с ценами GPT-5 в $1,25 за миллион входных токенов и $10 за миллион выходных токенов. Claude Sonnet 4.5 стоит $3 за миллион входных токенов и $15 за миллион выходных токенов.​

Затраты на обучение, по сообщениям, составили в общей сложности $4,6 миллиона, согласно источникам, на которые ссылается CNBC. Это контрастирует с миллиардами, потраченными OpenAI и другими американскими компаниями на разработку моделей.​

Модель доступна по модифицированной лицензии MIT на Hugging Face, предоставляя полные коммерческие права и права на создание производных продуктов с одним условием: продукты, превышающие один миллион активных пользователей в месяц или генерирующие более $20 миллионов в месяц, должны отображать «Kimi K2» на видном месте в пользовательском интерфейсе. Разработчики могут получить доступ к модели через платформу Moonshot по адресам platform.moonshot.ai и kimi.com.​

Этот релиз продолжает тенденцию китайских компаний развертывать открытый ИИ для конкуренции с западными проприетарными системами. Генеральный директор Airbnb Брайан Чески недавно заявил, что его компания «в значительной степени полагается» на модели Qwen от Alibaba для ИИ-обслуживания клиентов, хваля их как «очень хорошие», а также «быстрые и недорогие» по сравнению с ChatGPT.​

Moonshot AI, основанная в 2023 году при поддержке Alibaba и Tencent, привлекла $1 млрд в феврале 2024 года при оценке в $2,5 млрд, в августе 2024 года еще один раунд инвестиций предоставил компании дополнительно $300 млн.​