Hitech logo

Кейсы

MiniMax выпустила модель M1: качество как у GPT-4, а обучение в 200 раз дешевле

TODO:
Екатерина Шемякинская23 июня, 17:42

Малоизвестные в США китайские ИИ-лаборатории практически каждые несколько месяцев выпускают модели, которые меняют представления о стоимости обучения передовых ИИ-систем — так в начале года всех удивил DeepSeek R1. Теперь на сцену выходит шанхайская компания MiniMax, ранее известная своими ИИ-играми. MiniMax представила модель M1, которая по уровню интеллекта и креативности не уступает лидерам рынка от OpenAI и Anthrophic, но при этом обходится в 200 раз дешевле. Если эти данные подтвердятся, M1 может изменить расстановку сил в индустрии ИИ.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

MiniMax заявила, что потратила всего $534 700 на аренду серверов для обучения своей модели M1. Это почти в 200 раз дешевле, чем, по оценкам экспертов, обошлась тренировка ChatGPT-4o — более $100 млн (точные данные OpenAI не раскрывает). Если цифры подтвердятся, это может серьезно встревожить инвесторов, вложивших сотни миллиардов долларов в закрытые ИИ-компании вроде OpenAI и Anthropic, а также акционеров Microsoft и Google. Разработка ИИ и так остаётся убыточным бизнесом. По данным The Information, OpenAI может потерять $14 млрд в 2026 году и не выйдет на прибыль до 2028-го.

Если модель MiniMax с открытым доступом действительно сопоставимы по качеству с продуктами OpenAI, это может ослабить позиции лидера. Уже сейчас OpenAI вынуждена снижать цены: недавно стоимость использования её модели o3 reasoning сократили на 80%, и это ещё до выхода M1.

Компаниям также больше не придется тратить огромные суммы на вычислительные мощности. Это потенциально снизит прибыль облачных провайдеров, таких как AWS, Azure и Google Cloud, а также уменьшит спрос на чипы Nvidia, которые сегодня являются основой дата-центров для ИИ.

Подобное уже происходило: заявление DeepSeek о сопоставимой с ChatGPT производительности при значительно меньших затратах на обучение обвалило акции Nvidia на 17% за один день, стерев $600 млрд рыночной стоимости.

Главная особенность M1 — большое «окно контекста» в 1 млн токенов, что эквивалентно примерно 7-8 книгам. Это значит, что модель может обрабатывать гораздо больше информации за раз, когда генерирует ответ. По этому параметру она превосходит такие ведущие модели, как OpenAI o3 и Anthropic Claude Opus 4, чьё контекстное окно всего 200 тысяч токенов. При этом у Gemini 2.5 Pro тоже окно в 1 млн токенов, а некоторые модели Meta Llama (организация признана экстремистской и запрещена в РФ) с открытым исходным кодом достигают 10 млн.

Пока утверждения MiniMax о модели M1 не получили независимого подтверждения. Это отличает её от DeepSeek R1, чью заявленную производительность быстро оценили сторонние разработчики.

Ближайшие дни покажут, примет ли ИИ-сообщество M1 с энтузиазмом или отнесется к ней прохладно. Сейчас все желающие могут бесплатно протестировать модель через API, который предоставляет сама MiniMax. Разработчики также могут бесплатно скачать M1 и запускать её на своих вычислительных ресурсах.

MiniMax поддерживают крупнейшие IT-гиганты Китая — Tencent и Alibaba. О компании известно немного: численность команды не раскрывается, а её CEO Ян Цзюньцзе остается непубличной фигурой. Помимо чат-бота MiniMax Chat, компания предлагает графический генератор Hailuo AI и приложение с аватарами Talkie. По её данным, продукты MiniMax используют десятки миллионов пользователей в 200 странах, а корпоративными клиентами стали более 50 000 компаний. Особый интерес вызвал Hailuo — за счёт функции мгновенной генерации видеоигр. Выпуск модели M1 приобретает особое значение в контексте технологического соперничества между Китаем и США, особенно в области искусственного интеллекта.