Hitech logo

Кейсы

Новая модель ByteDance превосходит Claude Opus 4.6 и стоит в 5 раз дешевле

TODO:
Екатерина ШемякинскаяСегодня, 09:00 AM

Компания ByteDance, создатель TikTok, анонсировала обновлённую линейку ИИ-моделей под брендом Volcano Engine. Главная новинка — Doubao 2.1 Pro, которая, по заявлению компании, превосходит Claude Opus 4.6 по ряду показателей при стоимости почти на 80% ниже. Также анонсирована видеомодель Seedance 2.5 с генерацией роликов до 30 секунд и инструменты для работы с изображениями и звуком.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Doubao 2.1 Pro получила улучшения в нескольких направлениях: программировании, работе ИИ-агентов и анализе визуальной информации. Модель показала высокие результаты в тестах Terminal Bench 2.1, SWE-Pro и SciCode для задач генерации и анализа кода, а также заняла лидирующие позиции в OSWorld, MobileWorld и MMMU-Pro, оценивающих возможности автономных агентов и мультимодальных систем. Компания утверждает, что по ряду показателей Doubao 2.1 Pro превосходит Claude Opus 4.6.

Одним из ключевых преимуществ новой модели ByteDance называет стоимость. Использование Doubao 2.1 Pro обходится в 6 юаней (~$0.83) за миллион входных токенов и 30 юаней (~$4.14) за миллион выходных токенов, а обработка кэшированных данных стоит 1,2 юаня. По оценке разработчиков, общая стоимость владения моделью почти на 80% ниже, чем у Claude Opus 4.6. Для приложений с большим числом запросов компания также предлагает версию Turbo с ещё более низкой ценой.

Интерес к моделям семейства Doubao продолжает расти: по состоянию на июнь ежедневный объём обработки токенов превысил 180 трлн — более чем в десять раз больше, чем годом ранее. Согласно данным IDC, Volcano Engine занимает 49,5% китайского рынка публичных облачных сервисов MaaS (Model as a Service), предоставляющих доступ к ИИ-моделям через облачную инфраструктуру.

ByteDance также развивает направление генеративного видео. Новая модель Seedance 2.5 сможет создавать ролики продолжительностью до 30 секунд за один запрос и работать одновременно с 50 мультимодальными элементами.

Модель получила инструменты локального редактирования, которые позволяют изменять отдельные части видео без потери визуальной целостности между кадрами. Компания уже применяет предыдущие версии Seedance в электронной коммерции, промышленности и для синтеза данных в системах автономного вождения.

Помимо видео, ByteDance представила новые инструменты для работы с изображениями и звуком. Модель Seedream 5.0 Pro получила функции генерации изображений с интерактивным редактированием и многослойным разделением объектов, а Seed-Audio 1.0 научилась создавать аудиосцены с несколькими персонажами, фоновой музыкой и звуковыми эффектами без предварительного обучения под конкретную задачу.

Также компания расширила экосистему Volcano Engine для корпоративного применения ИИ. ByteDance запустила Ark CLI для быстрого развёртывания агентов, обновила платформы AgentKit и HiAgent до версии 3.0 и представила ArkClaw — рабочую среду для ИИ-агентов корпоративного уровня. Платформой Volcano Ark пользуются более 1,1 млн компаний и разработчиков, а около 200 организаций уже превысили показатель в 1 трлн ежегодных обращений к токенам.