Рекомпиляция модели — это процесс создания ASR-модели на основе уже существующей, в которую будут добавлены пользовательские слова и словосочетания.

Новые слова берутся из двух источников — телефонной книги и таблицы extended_words, которой управляет ecss-clerk (автосекретарь). На основе телефонной книги строится корпус слов с перестановками, добавлением вариантов имен с сокращениями (которые берутся из таблицы aliases). То есть после рекомпиляции получается модель, в которой есть все имена из телефонной книги.

Если нужно добавить свои алиасы и дополнительные слова, то нужно воспользоваться API добавление слов в базу.

После этого можно запустить рекомпиляцию, отправив на API соответствующий запрос.

Пример:

Запрос:curl localhost:9010/model/recompile

Ответ:
{
"msg": "Recompile process start sucessfully" 
}
CODE

Мониторинг за состоянием рекомпиляции, осуществляется командой:

journalctl -u kaldi-ru.service
CODE

Также можно следить за рекомпиляцией через логи /var/log/kaldi/model/build_model.log

Процесс рекомпиляции занимает 10-15 минут.

Если после рекомпиляции, распознавание слов не улучшилось, то можно воспользоваться ручными настройками через таблицу hard_aliases.