Hitech logo

Кейсы

Открытая модель GLM-5.2 обошла GPT-5.5 в программировании и стоит в разы дешевле

TODO:
Екатерина ШемякинскаяСегодня, 09:00 AM

Китайский стартап Z.ai выпустил в открытом доступе модель GLM-5.2 с 753 млрд параметров, которая приблизилась к уровню закрытых лидеров в ряде бенчмарков. В тестах на программирование новинка превзошла GPT-5.5, а в агентных задачах практически догнала Claude Opus 4.8. Модель распространяется под лицензией MIT и стоит примерно в шесть раз дешевле флагманских коммерческих решений.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

GLM-5.2 стала одной из немногих моделей с открытыми весами, которые смогли соперничать с закрытыми системами вроде GPT-5.5, Claude Opus 4.8 и Gemini 3.1 Pro. Модель построена на архитектуре Mixture-of-Experts с 753 млрд параметров и распространяется под лицензией MIT. Главное преимущество открытого подхода — возможность самостоятельно развернуть систему, адаптировать её под собственные задачи и не зависеть от внешнего API.

Лучше всего GLM-5.2 показала себя в программировании. В тесте SWE-bench Pro, который оценивает способность моделей решать реальные задачи разработки ПО, модель получила 62,1 балла, опередив GPT-5.5 с результатом 58,6. В тесте Terminal-Bench 2.1 модель GLM-5.2 улучшила показатели по сравнению с предыдущей версией GLM-5.1, набрав 81,0 балла против 62,0, и стала первой открытой моделью, преодолевшей отметку в 80% на этом бенчмарке.

В области ИИ-агентов GLM-5.2 также приблизилась к закрытым конкурентам. В тесте MCP-Atlas, оценивающем работу с инструментами и способность моделей управлять сложными цепочками действий, GLM-5.2 набрала 77 баллов против 77,8 у Claude Opus 4.8 и 75,3 у GPT-5.5. Это означает, что открытая модель уже способна конкурировать с ведущими коммерческими решениями в сценариях, где ИИ самостоятельно использует внешние инструменты.

Одним из ключевых преимуществ GLM-5.2 стала стоимость. Доступ через API предлагается за $1,40 за миллион входных токенов и $4,40 за миллион выходных токенов, что гораздо ниже цен закрытых моделей. По оценкам аналитиков, в некоторых сценариях использования стоимость работы GLM-5.2 может быть примерно в шесть раз ниже по сравнению с флагманскими коммерческими решениями.

При этом закрытые модели сохраняют преимущества в ряде областей. GPT-5.5 остается сильным универсальным инструментом с развитой экосистемой, Claude Opus 4.8 востребован в длительных инженерных задачах и сложном рефакторинге, а Gemini 3.1 Pro делает ставку на работу с большими объемами информации. Пользователи отмечают, что в наиболее сложных задачах с открытым ответом закрытые модели пока часто выглядят более отточенными.

Эксперты также выделяют преимущество GLM-5.2 в работе с длинным контекстом: модель поддерживает окно до миллиона токенов, что позволяет обрабатывать объемные документы, базы данных и проекты. Для компаний с требованиями к безопасности данных возможность локального развертывания становится одним из главных аргументов в пользу открытых моделей.