Впервые функция голосового режима была представлена в мае этого года. Новый помощник может отвечать на письменные и визуальные запросы с помощью голоса. Однако запуск был отложен на несколько месяцев, так как были выявлены возможные проблемы с безопасностью. В июле OpenAI протестировала эту функцию на ограниченном числе подписчиков ChatGPT Plus, а теперь она доступна более широкой аудитории.
Главной особенностью голосового ассистента является его способность отвечать на запросы пользователей голосом, при этом алгоритм не сможет имитировать речь других людей, предотвращая создание фейков. В целях безопасности также были добавлены фильтры, которые позволяют определять и блокировать запросы, связанные с созданием защищённого авторским правом аудиоконтента, например, музыки.
OpenAI также анонсировала добавление ещё 5 голосов, таким образом увеличив их общее количество до 9. Среди новых голосов — варианты с названиями, такими как «Arbor», «Spruce» и «Maple». Однако некоторые из ранее заявленных возможностей, например, использование компьютерного зрения для взаимодействия через камеру смартфона, пока не реализованы. Например, в демонстрационной версии голосовой помощник мог оценить интерьер комнаты или наряд собеседника.
Компания заявила, что продолжит развивать технологию голосового ассистента и добавлять новые функции в будущем.