Hitech logo

Кейсы

Alibaba выпустила ИИ-агента Qwen3.7-Max — он способен работать 35 часов без человека

TODO:
Екатерина ШемякинскаяСегодня, 10:12 AM

Китайская корпорация представила флагманскую модель искусственного интеллекта Qwen3.7-Max. Новинка является универсальной платформой для ИИ-агентов: она способна часами выполнять сложные инженерные и офисные задачи без участия человека, самостоятельно исправлять ошибки и удерживать контекст. В тестах модель превзошла аналоги от Anthropic и DeepSeek. В отличие от предыдущих версий Qwen, новая модель не имеет открытых весов и доступна только через платный API Alibaba Cloud.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Alibaba утверждает, что Qwen3.7-Max непрерывно выполняла инженерную задачу на протяжении 35 часов. В ходе теста ИИ получил доступ к серверу с незнакомой для него аппаратной архитектурой T-Head ZW-M890 PPU и должен был оптимизировать вычислительное ядро. За это время модель выполнила 1158 вызовов инструментов, провела 432 вычисления, самостоятельно исправляла ошибки и постепенно улучшала код. В итоге производительность системы выросла примерно в десять раз.

Разработчики отмечают, что одна из главных проблем языковых моделей — потеря логики и контекста при долгой работе. Обычно ИИ начинает забывать инструкции, допускать ошибки или «зацикливаться». Qwen3.7-Max создавалась именно для решения этой проблемы.

В Alibaba называют модель «универсальной агентной платформой», способной поддерживать сложные рассуждения и стабильную работу на протяжении тысяч последовательных шагов.

Для обучения новой модели компания использовала подход «масштабирования среды». Вместо того чтобы просто увеличивать объем текстовых данных, разработчики создавали множество разнообразных сценариев, в которых ИИ учился принимать решения, работать с инструментами и адаптироваться к новым условиям. Например, в тесте YC-Bench модель проходила симуляцию годового жизненного цикла стартапа: нанимала сотрудников, анализировала контракты, выбирала клиентов и управляла ресурсами. В ходе этой симуляции ИИ смог сгенерировать виртуальную выручку в $2,08 млн — почти вдвое больше, чем предыдущая версия Qwen3.6-Plus.

С точки зрения бизнеса Qwen3.7-Max позиционируется как универсальный инструмент для разработки ПО, автоматизации офисных задач и инженерных работ. Модель поддерживает контекст до 1 млн токенов и максимальный лимит выходных данных в 64 тыс., что позволяет ей обрабатывать большие объёмы кода и документации. Она способна автоматически форматировать документы, редактировать отчёты, оформлять научные работы по стандартам, создавать таблицы, презентации и визуализации. При этом система совместима с популярными агентными платформами и инструментами разработчиков, включая Claude Code и OpenClaw, работающие через API Anthropic и MCP-протоколы.

В тестах Alibaba новая модель показала высокие результаты в математике, программировании и логических задачах. В ряде бенчмарков Qwen3.7-Max превзошла Claude Opus-4.6 Max и DeepSeek V4-Pro Max.

При этом Alibaba постаралась сделать использование модели дешевле западных аналогов. Стоимость API составляет $2,5 за миллион входных токенов и $7,5 за миллион выходных токенов, в сумме $10. Для сравнения, использование GPT-5.4 от OpenAI обойдётся в $17,5 за миллион токенов, а Claude Opus 4.7 от Anthropic — $30.

Предыдущие версии Qwen публиковались с открытыми весами и активно использовались сообществом разработчиков локальных ИИ-систем. Однако Qwen3.7-Max доступна только через облачную инфраструктуру Alibaba Cloud. Это вызвало смешанную реакцию: эксперты высоко оценили технический уровень модели и ее способность к длительной автономной работе, но многие разработчики были разочарованы закрытым форматом. Qwen3.7-Max стала очередным признаков того, что индустрия окончательно вошла в «эпоху агентов».