Голосовые сообщения
Аудио
Last updated
Аудио
Last updated
Данный функционал позволяет гибко настраивать ИИ-агента при работе с голосовыми сообщениями и аудио файлами.
Разберем функционал на блоки.
Реакция агента на получение аудиофайлов: Тут вы разрешаете ИИ-агенту отвечать пользователю текстовым сообщением или распознавать голосовое сообщение.
Модель распознавания. Whisper и Deepgram - это две технологии, которые помогают распознавать речь. - Whisper: Поддерживает большее количество языков, и автоматически определяет язык собеседника. - Deepgram: Имеет большую точность, но необходимо сразу указать на каком языке будут обращения.
Голосовой ответ. Возможность ИИ-агента синтезировать речь и отвечать пользователю голосовым сообщением, но необходима интеграция с ElevenLabs. Для большей информации перейдите на страницу "Интеграции" в документации.
Вариант 1:
Реакция агента на получение аудиофайлов: Отвечать стандартным сообщением => Голосовой ответ: Никогда.
При данной настройке, если пользователь отправит голосовое сообщение, то ИИ-агент ответит текстовым сообщением, которые вы указали во вкладке "Прочие файлы", например "Мне не удобно прослушивать, отправьте текстом", или любое другое сообщение исходя из вашего проекта.
Вариант 2:
Реакция агента на получение аудиофайлов: Распознавать голос => Голосовой ответ: Никогда.
При данной настройке, если пользователь отправит голосовое сообщение, то ИИ-агент сможет распознавать голосовое сообщение и ответить текстовым сообщением.