Голосовые сообщения

Аудио

PreviousРабота с файлами NextИзображения

Last updated 22 days ago

Голосовые сообщения

Аудио

Данный функционал позволяет гибко настраивать ИИ-агента при работе с голосовыми сообщениями и аудио файлами.

Разберем функционал на блоки.

Реакция агента на получение аудиофайлов: Тут вы разрешаете ИИ-агенту отвечать пользователю текстовым сообщением или распознавать голосовое сообщение.

Модель распознавания. ElevenLabs, Whisper, Deepgram - это технологии, которые помогают распознавать речь. - ElevenLabs: Обеспечивает наивысшее качество распознавания с наименьшим количеством ошибок на текущий момент и поддерживает множество языков. - Whisper: Поддерживает большее количество языков, и автоматически определяет язык собеседника. - Deepgram: Имеет большую точность, но необходимо сразу указать на каком языке будут обращения.

Примеры использования без голосового ответа (без интеграции с ElevenLabs).

Вариант 1:

Реакция агента на получение аудиофайлов: Отвечать стандартным сообщением => Голосовой ответ: Никогда.

При данной настройке, если пользователь отправит голосовое сообщение, то ИИ-агент ответит текстовым сообщением, которые вы указали во вкладке "Прочие файлы", например "Мне не удобно прослушивать, отправьте текстом", или любое другое сообщение исходя из вашего проекта.

Вариант 2:

Реакция агента на получение аудиофайлов: Распознавать голос => Голосовой ответ: Никогда.

При данной настройке, если пользователь отправит голосовое сообщение, то ИИ-агент сможет распознавать голосовое сообщение и ответить текстовым сообщением.