Hitech logo

Кейсы

OpenAI впервые за шесть лет представила открытые ИИ-модели

TODO:
Екатерина Шемякинская6 августа, 13:33

OpenAI выпустила модели с открытыми весами — gpt-oss-120b и gpt-oss-20b. Они доступны для бесплатного скачивания и коммерческого использования под лицензией Apache 2.0 на Hugging Face, Azure, AWS и Databricks. Лёгкая версия запускается даже на обычном ноутбуке с 16 ГБ памяти. Модели поддерживают логическое мышление, управление инструментами и работают на уровне закрытых решений OpenAI. Выпуск стал ответом на усиливающуюся конкуренцию со стороны китайских лабораторий и запрос на открытость со стороны сообщества и регуляторов.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Модели выпускаются в двух размерах: более крупная и производительная модель gpt-oss-120b может работать на одном графическом процессоре NVIDIA, а более легкая gpt-oss-20b — на потребительском ноутбуке с 16 ГБ памяти. Обе модели совместимы с популярными фреймворками, включая FlashInfer, llama.cpp, Hugging Face и vLLM, а также интегрированы в стек NVIDIA TensorRT-LLM.

Открытые модели обучены с помощью тех же методов, что и закрытые — подход «смешанных экспертов» (MoE) и обучение с подкреплением (RL). gpt-oss-120b, несмотря на 117 млрд параметров, активирует лишь 5,1 млрд на токен, а gpt-oss-20b — 3,6 млрд из 21 млрд. Это повышает эффективность и снижает вычислительные затраты. Обе модели поддерживают контекст до 128 000 токенов и обладают высокой скоростью вывода — до 1,5 млн токенов в секунду на новых системах NVIDIA GB200 NVL72 с архитектурой Blackwell.

По данным OpenAI, открытые модели хорошо справляются с управлением ИИ-агентами и могут использовать инструменты вроде веб-поиска и выполнения кода Python в рамках рассуждений. Однако они работают только с текстом и не поддерживают обработку изображений или аудио. В таких случаях открытые модели смогут перенаправлять сложные запросы на более мощные облачные модели OpenAI.

В тестах на программирование, здравоохранение и математику (Codeforces, HealthBench, AIME) новые модели показали высокие результаты, в некоторых случаях опережая решения OpenAI o1 и o4-mini, а также модели DeepSeek. Однако в задачах, требующих точного знания, например, PersonQA, модели продемонстрировали высокий уровень «галлюцинаций» — 49% и 53% соответственно, что в три раза больше, чем у o1.

Модели лицензированы по Apache 2.0 и доступны для бесплатного скачивания на платформах Hugging Face, Azure, AWS и Databricks. Это значит, что их можно использовать в коммерческих целях без ограничений. Однако OpenAI не раскрывает датасеты, использованные для обучения, ссылаясь на риски нарушения авторских прав и безопасность. При этом, по словам исследователей OpenAI, gpt-oss — их самая протестированная модель. Она прошла проверку как внутренними командами, так и независимыми экспертами на предмет угроз в области кибербезопасности и биологической опасности. OpenAI не обнаружила признаков высокого риска.

Это первые модели OpenAI с открытыми весами со времён GPT-2, выпущенной более шести лет назад. Запуск gpt-oss стал ответом на растущую конкуренцию со стороны китайских ИИ-лабораторий, таких как DeepSeek и Qwen, а также давление со стороны американских властей.

В июле администрация Трампа настоятельно призвала американских разработчиков открыть исходный код своих технологий. Генеральный директор OpenAI Сэм Альтман ранее признал, что компания была «на неправильной стороне истории», отказываясь от открытого ИИ. Теперь OpenAI рассчитывает вернуть доверие разработчиков и внести вклад в развитие безопасного искусственного интеллекта.