Автоматическое распознавание речи (ASR)
Услуга доступна начиная с версии ПО 3.11.2
Основные понятия
Для более гибкого взаимодействия абонента АТС и IVR сценария, были добавлены функции по управлению голосом.
Конфигурация сервиса
Установка сервиса
Пакет ASR устанавливается из основного репозитория ECSS-10 с использованием следующей команды:
sudo aptitude install ecss-asr
Запуск сервиса
Для запуска ASR требуется запустить сервис ecss-asr.service:
sudo systemctl start ecss-asr
А так же убедиться, что сервис systemd-resolved.service запущен:
sudo systemctl status systemd-resolved ● systemd-resolved.service - Network Name Resolution Loaded: loaded (/lib/systemd/system/systemd-resolved.service; enabled; vendor preset: enabled) Drop-In: /lib/systemd/system/systemd-resolved.service.d └─resolvconf.conf Active: active (running) since Вт 2025-04-23 10:09:05 +07; 30 days ago Docs: man:systemd-resolved.service(8)
Если сервис systemd-resolved.service находится в состоянии Active: inactive, то сервис следует запустить следующей командой:
sudo systemctl start systemd-resolved
Языковые модели
Сервис ASR использует специальные модели, описывающие слова звуками. Основная модель хранится по пути:
/usr/lib/ecss/ecss-asr/model/ru.dic
В этом файле находятся все слова доступные для распознавания речи. При этом, во время работы, для повышения эффективности и точности, ASR использует только часть слов из модели. Эти слова хранятся в файле грамматики языка JSGF:
/etc/ecss/ecss-asr/ivr.jsgf
Подробнее с структурой файла грамматики можно ознакомиться в официальной документации.
Использование сервиса
Проверка лицензии ASR
Для использования сервиса требуется специальная лицензия. При доступной лицензии, в подробной информации по лицензии будет следующая строка:
cluster/storage/ds1/licence/show-licence --details 1 ... Automatic Speech Recognition (ASR) subsystem enabled true ...
Использование в IVR
Сервис ASR предлагается использовать в IVR редакторе. Если сервис ASR включен и активирован, то в таблице "Список пунктов IVR меню, выбираемых абонентов" для блока "Проигрывание интерактивного меню" в IVR редакторе появится новый столбец "Распознаваемые фразы".
При двойном клике по полю из столбца "Распознаваемые фразы" раскрывается модальное окно "Редактор распознаваемых фраз."
- Выбор абонента — цифра, по нажатию на которую, абонент может продублировать ответ
- Описание — текстовое описание данного варианта выбора
- Распознаваемые фразы — слово или фраза, которые будут детектироваться в прямой речи абонента. Если слово или фраза будут найдены — скрипт продолжит выполняться по данной ветви.
- Распознаваемые фразы — слово или фраза, которые будут детектироваться в прямой речи абонента. Если слово или фраза будут найдены — скрипт продолжит выполняться по данной ветви.
ASR и настройки MSR
Иногда для корректной работы ASR необходимо будет устранить "ложные" срабатывания на посторонние звуки. Для этого необходимо произвести настройку параметра silence-threshold путем уменьшения чувствительности (увеличения значения silence-threshold например до уровня -20 дБ). Прочитать об этом можно в разделе Настройка конфигурационного файла MSR