Особенность новой технологии, разработанной специалистами Technicolor, университетов Стэнфорда и Бат, Института Макса Планка и Технического университета Мюнхена — в ее фундаментальности. Взяв за образец видео с изображением объекта операции, в данном случае это Барак Обама, можно управлять мимикой его лица, движением головы, фоном и так далее, используя в качестве опоры и источника визуальной информации собственное лицо. Поэтому с одного объекта на другой переносится не только движение тела и лица, но и мельчайшие нюансы мимики. При этом сохраняется высокая точность и правдоподобие изображения — если присмотреться к видео ниже, можно заметить даже правильно наложенные тени позади человека.
«Наш результат почти неотличим от реального видео», — пишут исследователи. И это правда. С помощью этой технологии можно заставить любое публичное лицо сказать все, что вы хотите — правда, вашим собственным голосом. Звук эта нейросеть не подделывает. Но создавали ее, очевидно, для другого: чтобы можно было дублировать или озвучивать фильмы, точнее передавая эмоции актера озвучания.
Есть у технологии и границы — например, нельзя заставить хмурого человека широко улыбнуться (точнее, можно, но это будет выглядеть подозрительно). Но по сравнению с прошлогодними опытами в этом направлении прогресс несомненен.
«Я понимаю этические последствия, — говорит соавтор исследования Юстус Тайс. — Это еще одна причина, почему мы опубликовали наши результаты. Я думаю, важно, чтобы люди понимали возможности манипуляционных технологий».