Чтобы создать клона, требуется всего 24 часа. Услуга доступна как на китайском, так и на английском языках. Некоторые аспекты, такие как фон и тон, настраиваются. В видеороликах нет плоской интонации и монотонной речи, характерных для традиционных акустических моделей, за счет использования собственной технологии настройки тембра с малыми выборками, основанной на акустических моделях глубокого обучения и вокодерах нейронных сетей.
Tencent предлагает пять стилей для цифровых людей: 3D-реалистичный, 3D-полуреалистичный, 3D-мультфильм, 2D-реальный человек и 2D-мультфильм. Для цифрового человека можно создать индивидуальные вопросы и ответы, превращая его в своего рода дипфейкового чат-бота.
Tencent считает, что цифровые копии можно использовать в рекламных роликах в прямом эфире — популярной формы электронной коммерции в Китае. Местные СМИ также сообщили, что Tencent может создать врачей, юристов и других специалистов.
Чен Лэй, генеральный менеджер Tencent Cloud Intelligent Digital Human Products, рассказал о планах компании построить автоматизированную «цифровую интеллектуальную человеческую фабрику AI +». Фабрика будет опираться на Tencent Cloud TI — платформу машинного обучения, которая предлагает более десяти алгоритмов искусственного интеллекта.
Пекин уже вмешался в регулирование технологии дипфейков. В январе Управление киберпространства Китая начало требовать от «поставщиков услуг глубокого синтеза» гарантии того, что их алгоритмы искусственного интеллекта не используются не по назначению для незаконных действий, таких как мошенничество, мошенничество и фейковая информация.