В предыдущих версиях продукта аватары разговаривали без каких-либо эмоций, однако перед нынешним релизом стартап тщательно поработал над их динамичностью. По словам компании, теперь аватары используют правильный тон голоса, язык тела и движения губ, как живые актёры.
Кроме того, новая модель позволяет системе генерировать результаты в реальном времени: программа воспринимает текст, анализирует его настроение и сразу же выдает нужную эмоцию и выражение лица. Ранее такие аватары полагались на заранее написанный сценарий, из-за чего результаты могли быть неестественными. Synthesia утверждает, что модели достаточно, чтобы создать полностью уникальный видеоролик, а готовый результат не придется исправлять в других программах. Пользователи также могут заново сгенерировать видеоряд, изменив запрос.
Synthesia признает, что её технология может быть использована злоумышленниками. В ответ компания разрабатывает методы раннего обнаружения мошеннических действий, увеличивает количество команд, работающих над безопасностью ИИ, и экспериментирует с технологиями удостоверения подлинности цифрового контента, такими как C2PA.