Рейтинг Code Arena оценивает не только способность генерировать код, но и эффективность ИИ в реальных сценариях разработки. Qwen3.7-Max показала высокие результаты в сложной отладке, работе с многофайловыми проектами, вызове инструментов и автоматизации программных процессов. Разработчики отмечают, что модель уже приблизилась к уровню, подходящему для использования в производственной среде.
Главной особенностью новой системы Alibaba стала её агентная архитектура. Модель способна длительное время автономно выполнять сложные задачи без вмешательства человека, сохраняя контекст, исправляя собственные ошибки и адаптируясь к изменяющимся условиям.
В Alibaba утверждают, что Qwen3.7-Max может непрерывно работать до 35 часов подряд.
Qwen3.7-Max также поддерживает контекст объёмом до 1 млн токенов и может обрабатывать большие массивы кода и документации. Помимо программирования, система способна редактировать документы, создавать отчёты, таблицы, презентации и научные материалы. Модель совместима с популярными агентными платформами и инструментами разработчиков, включая Claude Code и решения, работающие через протоколы Anthropic API и MCP.
Alibaba заявляет, что API Qwen3.7-Max обходится заметно дешевле западных аналогов. Стоимость обработки миллиона токенов составляет около $10, тогда как использование моделей OpenAI и Anthropic может стоить значительно дороже. В отличие от предыдущих разработок Qwen с открытым кодом, это проприетарная, то есть закрытая, модель.
В сфере разработки ИИ по-прежнему доминируют американские компании. Лидирующие позиции занимают версии Claude от Anthropic, а OpenAI, xAI и Google занимают верхние строчки большинства рейтингов. Однако стремительный прогресс Alibaba, а также сильные результаты китайских лабораторий DeepSeek, Zhipu и Moonshot показывают, что американское лидерство в создании ИИ-моделей может быть под угрозой.

