Hitech logo

Кейсы

ИИ-инструмент Pindrop распознает звуковые дипфейки с точностью 99%

TODO:
Екатерина Смирнова16 августа, 09:14

Компания Pindrop представила новый веб-инструмент Pulse Inspect, который способен выявлять искусственно сгенерированную речь в любых аудио- или видеофайлах с точностью в 99%. Пользователю достаточно просто загрузить подозрительный файл, и приложение за несколько секунд проверит его достоверность. Система обучена на базе 350 инструментов генерации дипфейков и более 20 млн уникальных высказываний на 40 языках.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Хотя дипфейки существуют уже давно, развитие текстовых генеративных систем искусственного интеллекта способствовало тому, что они наводнили интернет. Популярные инструменты, подобные продуктам Microsoft и ElevenLabs, позволяют легко имитировать голос и видео известных личностей. Это создает благодатную почву для распространения дезинформации и мошенничества. Согласно исследованию Pindrop, 12 млн американцев уже сталкивались с дипфейками знакомых людей. Для борьбы с этой проблемой Pindrop разработала пакет продуктов Pulse. Первое решение помогало обнаруживать поддельные звонки в колл-центрах. Новый продукт, Pulse Inspect, позволяет анализировать любые аудио- и видеофайлы на наличие признаков искусственного интеллекта.

Сервис доступен в виде веб-приложения, где пользователи могут загрузить для проверки любой подозрительный файл. Раньше, чтобы найти следы подделки в аудио или видео, требовалась долгая судебная экспертиза. Теперь же инструмент анализирует аудио всего за несколько секунд, определяет уровень вероятности подделки и указывает на участки с искусственной речью. Благодаря этому компании могут быстро реагировать на угрозы и защищать свою репутацию.

Помимо веб-приложения, поддерживающего ручную загрузку файлов, Pulse Inspect также может быть интегрирован в пользовательские процессы с помощью API. Это позволяет автоматизировать обработку больших объемов данных, например, для обнаружения и удаления вредоносных видео, созданных с помощью искусственного интеллекта, в социальных сетях.

Функция доступна в бета-версии в рамках платформы Pindrop Pulse. Она позволяет обнаружить сгенерированную искусственным интеллектом речь, независимо от того, каким инструментом или моделью ИИ она была создана. Этот шаг идет вразрез с обычной практикой в отрасли, когда разработчики ИИ выпускают инструменты для обнаружения фейков, созданных только их собственными технологиями.

Pindrop обучила модель на более чем 350 инструментах генерации дипфейков, 20 млн уникальных высказываний и более чем 40 языках. Технология построена на последних достижениях в области глубоких нейронных сетей и сложного спектрально-временного анализа. Обработав 200 тысяч звуковых образцов, система обнаружила дипфейк-аудио с точностью 99%. Модель проверяет медиафайлы на наличие синтетических артефактов каждые четыре секунды. Это позволяет точно классифицировать дипфейки, особенно в случаях смешанных медиа, содержащих как искусственно сгенерированные, так и подлинные элементы. Инструмент может не распознать дипфейк, если файл содержит менее двух секунд чистой речи или имеет очень высокий уровень фонового шума. Компания работает над устранением этих недостатков и дальнейшим повышением точности обнаружения.

Pindrop предлагает Pulse Inspect по годовой подписке организациям, которым необходимо регулярно выявлять дипфейки. Среди них — медиакомпании, некоммерческие организации, государственные учреждения, фирмы по управлению репутацией знаменитостей, юридические фирмы и социальные сети. Точное количество клиентов неизвестно. Генеральный директор Виджай Баласубраманьян заявил, что компания может ввести более доступные ценовые планы с ограниченным количеством проверок медиафайлов и для потребителей.

В планах Pindrop — улучшить интерпретируемость результатов анализа, добавив функцию отслеживания источника создания дипфейков. Кроме того, компания намерена расширить поддержку различных типов данных, которые могут быть проанализированы с помощью этих инструментов.