Hitech logo

Кейсы

Google представила Lumier — продвинутый ИИ для создания видео

TODO:
Екатерина Смирнова24 января, 10:00

Google продемонстрировала работу модели пространственно-временной диффузии Lumiere. Новый ИИ-инструмент может создавать удивительно реалистичные видеоролики продолжительностью до пяти секунд. Нейросеть анимирует неподвижные изображения или только их части в ответ на текстовые подсказки на естественном языке. В отличие от своих предшественников, Lumiere строит всю длину видео сразу, а не генерирует первый и последний кадр, пытаясь угадать, что происходит между ними. Разработка является исследовательским проектом, и пока неизвестно, будет ли она доступна для широкого использования.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Lumiere может скопировать стиль изображения, а затем использовать этот стиль для создания серии видеороликов на другие темы. Нейросеть может взять исходное видео пользователя и превратить все в Лего, оригами или цветы.

Судя по демонстрациям, Lumiere обладает самыми продвинутыми возможностями рисования. Можно закрыть часть изображения, и Lumiere автоматически заполнит эту область — так органично, что вмешательство искусственного интеллекта будет невозможно заметить.

Исследовательская группа утверждает, что пространственно-временная архитектура U-net строит всю длину видео сразу, за один проход. Это отличает нейросеть от предыдущих моделей, которые часто генерировали начальный и конечный кадр, а затем пытались угадать, что произойдет между ними.

На данный момент это лишь исследовательский проект. Поэтому Google необязательно агрессивно нейтрализовать систему, чтобы соблюдать авторские права, конфиденциальность и безопасность, а также не допустить разжигания ненависти и наготы. Этот процесс неизменно приводит к снижению качества результата в генеративных моделях.