Данный документ содержит таблицу предупреждений, которые могут генерироваться в подсистеме Tring.
Подсистемой TRing осуществляется мониторинг нод, кластеров.
Таблица - Описание предупреждений подсистемы TRing
№ | Предупреждение | Класс | Важность | Описание | Действия оператора для устранения предупреждения |
---|---|---|---|---|---|
1 | Node <node_name> of "<cluster_name>" cluster is down | ecss::cluster::node | major | Данное предупреждение генерируется в случае, если определенная нода пропала из кластера. | Для устранения предупреждения необходимо: 1. Проверить, действительно ли нода остановлена. 2. Если нода остановлена, то запустить ноду командой: sudo systemctl start <release_name>. 3. Если нода запущена, то проверить систему на наличие сплита. Выполнить команду CLI: /node/nodes-info nodes. Устранить сплит. Изучить логи для выявления причин сплита. |
2 | Cluster "<cluster_name>" is down. "<system_name>" subsystem "<cluster_name>" is down. | ecss::cluster | critical | Данное предупреждение генерируется в случае, если определенный кластер пропал из системы (все ноды данного кластера пропали из системы). | Для устранения предупреждения необходимо: 1. Проверить, действительно ли ноды остановлены. 2. Если ноды остановлены (и это не плановые работы), то запустить ноды командой из под консоли Linux: sudo systemctl start <release_name>. 3. Если ноды запущены, изучить логи остановленной системы и обратиться в службу техподдержки. |