Kimi K2 Thinking достиг 44,9% в тесте Humanity’s Last Exam — передовом бенчмарке из 2500 проверенных экспертами вопросов, разработанном так, чтобы оставаться сложным по мере развития ИИ. Модель набрала 60,2% в BrowseComp — бенчмарке веб-исследований, где GPT-5 достиг 54,9%, а Claude Sonnet 4.5 — 24,1%. В SWE-Bench Verified, который тестирует решение реальных задач программной инженерии, K2 Thinking набрал 71,3%.
Согласно независимой оценочной фирме Artificial Analysis, K2 Thinking достиг высшего результата в агентском бенчмарке Tau2 Bench Telecom, который измеряет производительность ИИ в сценариях обслуживания клиентов, требующих использования инструментов. Модель способна автономно выполнять 200-300 последовательных вызовов инструментов, поддерживая логичное рассуждение на протяжении сотен шагов без вмешательства человека.
Moonshot AI указывает цены API K2 Thinking на уровне $0,15 за миллион токенов для кэшированного ввода, $0,60 за миллион для промахов кэша и $2,50 за миллион для вывода. Это сравнимо с ценами GPT-5 в $1,25 за миллион входных токенов и $10 за миллион выходных токенов. Claude Sonnet 4.5 стоит $3 за миллион входных токенов и $15 за миллион выходных токенов.
Затраты на обучение, по сообщениям, составили в общей сложности $4,6 миллиона, согласно источникам, на которые ссылается CNBC. Это контрастирует с миллиардами, потраченными OpenAI и другими американскими компаниями на разработку моделей.
Модель доступна по модифицированной лицензии MIT на Hugging Face, предоставляя полные коммерческие права и права на создание производных продуктов с одним условием: продукты, превышающие один миллион активных пользователей в месяц или генерирующие более $20 миллионов в месяц, должны отображать «Kimi K2» на видном месте в пользовательском интерфейсе. Разработчики могут получить доступ к модели через платформу Moonshot по адресам platform.moonshot.ai и kimi.com.
Этот релиз продолжает тенденцию китайских компаний развертывать открытый ИИ для конкуренции с западными проприетарными системами. Генеральный директор Airbnb Брайан Чески недавно заявил, что его компания «в значительной степени полагается» на модели Qwen от Alibaba для ИИ-обслуживания клиентов, хваля их как «очень хорошие», а также «быстрые и недорогие» по сравнению с ChatGPT.
Moonshot AI, основанная в 2023 году при поддержке Alibaba и Tencent, привлекла $1 млрд в феврале 2024 года при оценке в $2,5 млрд, в августе 2024 года еще один раунд инвестиций предоставил компании дополнительно $300 млн.

