Hitech logo

Кейсы

Anthropic запускает голосовой режим в Claude

TODO:
Екатерина Шемякинская28 мая, 11:54

Anthropic начала поэтапно внедрять голосовой режим в мобильное приложение чат-бота Claude. Пока функция находится в бета-версии, но вскоре позволит пользователям вести голосовые диалоги, обсуждать изображения и документы, выбирать голос, а также получать расшифровку и краткое содержание беседы.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Голосовой режим, пока в бета-версии, позволит пользователям мобильного приложения Claude вести «полноценные голосовые беседы» с чат-ботом и появится на английском языке в течение следующих нескольких недель. Об этом Anthropic сообщила в X и обновленной документации на своем сайте. Но, по крайней мере, один пользователь X уже получил доступ к новой функции.

Голосовой режим Anthropic позволит обсуждать документы и изображения, выбирая из пяти разных голосов. Можно будет легко переключаться между текстом и голосом, а после разговора увидеть его расшифровку и краткое содержание. По умолчанию эта функция использует модель Claude Sonnet 4.

Есть ограничения — голосовые беседы учитываются в общих лимитах использования. Anthropic сообщает, что большинству бесплатных пользователей будут доступны 20-30 таких разговоров.

Кроме того, только платные подписчики Claude могут использовать интеграцию с Google Workspace, которая открывает голосовому режиму доступ к встречам в Google Calendar и письмам Gmail. Интеграция с Google Docs доступна только в корпоративных тарифах Claude Enterprise.

Директор по продуктам Anthropic Майк Кригер в интервью Financial Times в начале марта подтвердил, что компания работает над голосовыми возможностями для Claude. Anthropic вела переговоры с Amazon, своим крупным инвестором и партнером, а также с ИИ-стартапом ElevenLabs, чтобы, возможно, развивать будущие голосовые функции для Claude. Неясно, реализовались ли эти партнерства.

Многие компании, включая OpenAI, уже предлагают голосовое общение со своими чат-ботами. Например, у Google есть Gemini Live, а у xAI — голосовой режим для Grok. Эти функции позволяют пользователям общаться с ботами голосом, а не печатать, что делает взаимодействие более естественным и удобным.