Lumiere может скопировать стиль изображения, а затем использовать этот стиль для создания серии видеороликов на другие темы. Нейросеть может взять исходное видео пользователя и превратить все в Лего, оригами или цветы.
Судя по демонстрациям, Lumiere обладает самыми продвинутыми возможностями рисования. Можно закрыть часть изображения, и Lumiere автоматически заполнит эту область — так органично, что вмешательство искусственного интеллекта будет невозможно заметить.
Исследовательская группа утверждает, что пространственно-временная архитектура U-net строит всю длину видео сразу, за один проход. Это отличает нейросеть от предыдущих моделей, которые часто генерировали начальный и конечный кадр, а затем пытались угадать, что произойдет между ними.
На данный момент это лишь исследовательский проект. Поэтому Google необязательно агрессивно нейтрализовать систему, чтобы соблюдать авторские права, конфиденциальность и безопасность, а также не допустить разжигания ненависти и наготы. Этот процесс неизменно приводит к снижению качества результата в генеративных моделях.