Hitech logo

Тренды

OpenAI представила Sora 2 — ИИ-генератор видео с реалистичной физикой

TODO:
Роман СавицкийСегодня, 08:57 AM

OpenAI сделала ещё один шаг к созданию универсальной фабрики цифровой реальности. Компания представила модель Sora 2 — новый генератор видео и аудио, который, по словам разработчиков, способен имитировать физику и логику событий на уровне, близком к человеческому восприятию. В OpenAI сравнивают её значение с дебютом GPT-3.5, который когда-то радикально изменил генерацию текста. Теперь аналогичный «скачок» обещают для мультимедиа: видео, создаваемое Sora 2, не только выглядит правдоподобно, но и подчиняется законам физики, логике движения и взаимодействия объектов.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Ранние генераторы часто выдавали красивую, но искусственную картинку, где баскетбольный мяч «телепортировался» в корзину или фигуристка выполняла элемент без малейшего риска упасть. Sora 2 демонстрирует иной подход: мяч при промахе отскакивает от щита, спортсменка может потерять равновесие, а персонаж аниме — сражаться с врагом, сохраняя динамику сцены. «Ошибки» и неудачи, столь важные для ощущения реальности, впервые стали органичной частью ИИ-симуляции. Это открывает перспективы не только в сфере развлечений, но и в разработке тренажёров и робототехники, где моделирование мира должно быть максимально близким к настоящему.

Особое внимание OpenAI уделяет контролируемости: модель удерживает целостность сцены на протяжении длинных и многоступенчатых роликов. Она способна синхронно отслеживать локации, свет, эмоции персонажей, не разрушая внутреннюю логику повествования. Демонстрационные примеры — фигуристка с котом на голове или герои аниме в зрелищной битве — показывают, что система уверенно совмещает комические и фантастические элементы с реалистичной динамикой.

Модель также интегрирует аудио: создаёт речь, фоновые шумы и музыкальные дорожки с высокой точностью. При этом в ролик можно встроить самого себя или любого человека. Достаточно короткой видеозаписи, чтобы Sora 2 воспроизвела внешность, мимику и голос, органично встраивая их в любую сцену. Эта функция, получившая название «камео», стала центральным элементом нового социального приложения Sora для iOS.

Приложение, запущенное одновременно с моделью, позволяет пользователям генерировать и обмениваться роликами, делать ремиксы и находить новые работы в персонализированной ленте. С помощью «камео» можно буквально попасть в чужую историю, будь то спортивная арена или фантастический сюжет. «Мы считаем, что социальное приложение, построенное вокруг функции „камео“, — лучший способ ощутить магию Sora 2», — заявили в OpenAI, отметив, что даже тестовый запуск внутри компании помог сотрудникам завести новых друзей.

Как и в случае с другими продуктами OpenAI, вопрос этики вынесен на первый план. Пользователь может контролировать, кто имеет доступ к его «камео»; любое видео с его участием доступно для удаления. Алгоритмы и модераторы должны предотвращать создание контента без согласия или с явным вредоносным содержанием.

Пока приложение доступно только владельцам iPhone в США и Канаде и работает по приглашениям. В ближайшие недели OpenAI планирует запустить веб-версию.

Базовый тариф бесплатен, с «щедрыми лимитами» генерации. Для подписчиков ChatGPT Pro готовится экспериментальная версия Sora 2 Pro с повышенным качеством. Вопрос монетизации остаётся открытым: пока компания намерена лишь взимать плату за дополнительные генерации при повышенном спросе. В планах — расширение географии, подключение API и интеграция Sora 2 в экосистему OpenAI.

Наблюдатели отмечают, что Sora 2 выходит на рынок в момент острой конкуренции в сфере генеративных видео. В последние месяцы Google представил модели Veo, Stability AI работает над текст-видео генераторами, а стартап Runway стремится укрепить позиции в нише видеомонтажа на базе ИИ. Однако ставка OpenAI на интеграцию физики и социального взаимодействия может выделить Sora 2 из ряда конкурентов и превратить её в платформу, где пользователи не только создают контент, но и сами становятся его героями.