Особенность Qwen3 в том, что она использует технологию «смеси экспертов». В этой системе внутри одной модели работают сразу несколько «специалистов», которые включаются только при необходимости. Так достигается высокая точность при меньших затратах на вычисления. Такой подход ранее уже применял стартап из Франции Mistral.
Модели Qwen3 умеют переключаться между двумя режимами работы. Первый режим — быстрые ответы, подходящие для простых задач. Второй режим, названный «Thinking Mode», более сложный и медленный, подходит для задач, требующих глубоких рассуждений и вычислений. Пользователь может включать этот режим специальной кнопкой или командами /think и /no_think.
Alibaba выпустила восемь вариантов Qwen3: 2 модели «смеси экспертов» и 6 классических моделей разных размеров — от 600 миллионов до 32 миллиардов параметров. Это позволяет использовать их на устройствах с различной вычислительной мощностью — от домашних ноутбуков до крупных серверов.
Модели обучены на большом объёме данных, который увеличился в 2 раза по сравнению с предыдущим поколением Qwen2.5. Для обучения использовали около 36 триллионов токенов текста, в том числе интернет-страницы, документы PDF и синтетические данные, созданные предыдущими версиями моделей. После основного обучения модели прошли дополнительные этапы настройки, что позволило улучшить качество ответов и возможность гибко выбирать режим работы.
Теперь Qwen3 доступна для бесплатного использования и интеграции через популярные платформы вроде Hugging Face, GitHub и Kaggle. Благодаря открытому исходному коду и лицензии Apache 2.0 компании могут настраивать модели под свои задачи и использовать их в коммерческих целях без дополнительных ограничений.
Для бизнеса это означает, что Qwen3 можно быстро внедрить в существующие системы, совместимые с OpenAI, при этом затраты на обслуживание будут значительно ниже. Компания также подчёркивает, что её модели помогают избежать рисков передачи данных сторонним сервисам, поскольку их можно запускать локально и самостоятельно контролировать весь процесс.