Hitech logo

Кейсы

Microsoft выпустила три быстрых и недорогих ИИ-модели под все типы контента

TODO:
Екатерина ШемякинскаяСегодня, 09:23 AM

Microsoft объявила о запуске сразу трех новых базовых моделей искусственного интеллекта, способных работать с разными типами контента — текстом, голосом и изображениями. Релиз закрепляет переход Microsoft от роли облачного провайдера для чужих нейросетей к статусу самостоятельного разработчика суперинтеллекта.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Новые модели получили названия MAI-Transcribe-1, MAI–Voice-1 и MAI–Image-2. Первая предназначена для распознавания речи и поддерживает 25 языков. По данным компании, скорость работы модели в 2,5 раза выше по сравнению с существующим решением Microsoft Azure Fast. Компания уже тестирует MAI-Transcribe-1 в режиме Voice в Copilot и Microsoft Teams для транскрипции разговоров.

MAI–Voice-1 отвечает за генерацию аудио и позволяет создавать до 60 секунд звука всего за одну секунду, включая возможность синтеза пользовательских голосов.

Третья модель, MAI–Image-2, ориентирована на генерацию визуального контента. Она была впервые представлена в прошлом месяце в тестовой среде MAI Playground, а теперь вместе с другими решениями стала доступна на платформе Microsoft Foundry. При этом инструменты для работы с речью и транскрипцией также остались доступны в экспериментальной среде для разработчиков.

Разработкой моделей занималась команда MAI Superintelligence — исследовательское подразделение компании, созданное в 2025 году. Его возглавляет Мустафа Сулейман, сооснователь Google DeepMind. По его словам, компания делает ставку на «гуманистический ИИ», ориентированный на реальные сценарии взаимодействия людей с технологиями.

Одним из ключевых преимуществ новых моделей Microsoft называет стоимость. Например, MAI-Transcribe-1 доступна по цене от $0,36 за час обработки аудио, а MAI–Voice-1 — от $22 за миллион символов. Для MAI–Image-2 цена начинается от $5 за миллион входных токенов и $33 за миллион токенов на генерацию изображений, что должно сделать решения более доступными для бизнеса.

Выход собственных моделей Microsoft стал следствием сдвига в юридических отношениях с OpenAI. До октября 2025 года корпорация была скована контрактом 2019 года, который запрещал ей самостоятельно разрабатывать общий искусственный интеллект (AGI) в обмен на роль эксклюзивного облачного провайдера. Однако после того как OpenAI начала искать вычислительные мощности на стороне (у SoftBank и других партнеров), Microsoft добилась пересмотра условий. Новое соглашение не только сохранило за IT-гигантом права на все разработки OpenAI до 2032 года, но и официально развязало ему руки для создания собственного суперинтеллекта. Ранее Microsoft инвестировала более $13 млрд в OpenAI.