Hitech logo

Тренды

Pika представила ИИ для наложения звука на движения губ

TODO:
Екатерина Смирнова28 февраля, 09:42

После выхода модели генерации видео Sora от OpenAI компания Pika выпустила новую функцию для своих платных подписчиков под названием Lip Sync. Эта опция позволяет пользователям добавлять в видео диалоги с голосами, сгенерированными искусственным интеллектом от стартапа ElevenLabs, специализирующегося на генерации звука. Кроме того, можно добавить анимацию, чтобы движения рта персонажа совпадали с тем, что он говорит. Все это можно делать прямо в процессе создания видео, без необходимости использовать сторонние инструменты при пост-обработке. Это еще один шаг в использовании искусственного интеллекта для создания полноценных сюжетных фильмов.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Благодаря поддержке ElevenLabs новая функция Pika Lip Sync поддерживает как преобразование текста в аудио, так и загруженные звуковые дорожки. Пользователь может записать речь для персонажей, сгенерированных искусственным интеллектом Pika, а также изменить звучание и интонацию голоса.

Видео, созданные Pika, пока менее качественные и реалистичные, чем те, что продемонстрировала модель Sora от OpenAI или другой стартап по генерации видео Runway. Но добавление новой функции Lip Sync выдвигает Pika вперед, поскольку предлагаемые возможности могут изменить традиционное программное обеспечение для создания фильмов.

С функцией Lip Sync Pika решает одну из последних преград в использовании искусственного интеллекта для создания полноценных фильмов с сюжетом. В отличие от других ведущих генераторов ИИ-видео, Pika позволяет легко добавлять речевой диалог и синхронизированные движения губ персонажей прямо в процессе создания видео. Ранее приходилось пользоваться сторонними инструментами и громоздкими дополнениями при пост-обработке.

Функция пока доступна только для подписчиков Pika Pro (подписка стоит $58 в месяц и оплачивается на 12 месяцев вперед за $696) или участников программы Super Collaborators от Pika, доступ к которой осуществляется по приглашению через группу Discord.

Многие авторы задаются вопросом, на каких данных обучалась видео-модель Pika, и обеспокоены, что их работы используются без их разрешения. Часть профессионального кинопроизводственного сообщества также опасается потери рабочих мест и сокращения качества производства из-за ИИ-видео. Однако, несмотря на это, компании продолжают развивать технологии и создавать инструменты для более качественной генерации видео.