Рекомпиляция модели — это процесс создания ASR-модели на основе уже существующей, в которую будут добавлены пользовательские слова и словосочетания.
Новые слова берутся из двух источников — телефонной книги и таблицы extended_words, которой управляет ecss-clerk (автосекретарь). На основе телефонной книги строится корпус слов с перестановками, добавлением вариантов имен с сокращениями (которые берутся из таблицы aliases). То есть после рекомпиляции получается модель, в которой есть все имена из телефонной книги.
Если нужно добавить свои алиасы и дополнительные слова, то нужно воспользоваться API добавление слов в базу.
После этого можно запустить рекомпиляцию, отправив на API соответствующий запрос.
Пример:
Запрос:curl localhost:9010/model/recompile
Ответ:
{
"msg": "Recompile process start sucessfully"
}
CODE
Мониторинг за состоянием рекомпиляции, осуществляется командой:
journalctl -u kaldi-ru.service
CODE
Также можно следить за рекомпиляцией через логи /var/log/kaldi/model/build_model.log
Процесс рекомпиляции занимает 10-15 минут.
Если после рекомпиляции, распознавание слов не улучшилось, то можно воспользоваться ручными настройками через таблицу hard_aliases.