Данный функционал позволяет гибко настраивать ИИ-агента при работе с голосовыми сообщениями и аудио файлами.
Реакция агента на получение голосовых сообщений.
Отвечать стандартным сообщением:
С помощью данной опции вы разрешаете ИИ-агенту отвечать пользователю только заготовленным вами текстовым сообщением, например:
Я не могу распознавать голосовые сообщения, напишите текстом.
Распознавать голос:
Модель распознавания: ElevenLabs, Whisper, Deepgram - это технологии, которые помогают распознавать речь
- ElevenLabs: Обеспечивает наивысшее качество распознавания с наименьшим количеством ошибок на текущий момент и поддерживает множество языков.
- Whisper: Поддерживает большее количество языков, и автоматически определяет язык собеседника, устанавливается по умолчанию.
- Deepgram: Имеет большую точность, но необходимо указывать на каком языке будут обращения.
— Стоимость распознавания: 1 Botcoin за минуту аудиозаписи
— Работает с: WhatsApp, VK, Авито, Авито PRO, Instagram и Telegram
Голосовой ответ
У ИИ-агента есть возможность синтезировать речь и отвечать пользователю голосовым сообщением, но для этого необходима интеграция с ElevenLabs. Для большей информации перейдите на страницу "Интеграции" в документации.
Примеры использования без голосового ответа (без интеграции с ElevenLabs).
При данной настройке, если пользователь отправит голосовое сообщение, то ИИ-агент ответит текстовым сообщением, которые вы указали в "Стандартное сообщение для аудиофайлов", например "Мне не удобно прослушивать, отправьте текстом", или любое другое сообщение исходя из вашего проекта.
При данной настройке, если пользователь отправит голосовое сообщение, то ИИ-агент сможет распознавать голосовое сообщение и ответить текстовым сообщением.