Таблица - Описание предупреждений подсистемы RPS
№ | Предупреждение | Класс | Важность | Описание | Действия оператора для устранения предупреждения |
---|---|---|---|---|---|
1 | Application <app_name> is not running | host::application | critical | Данное предупреждение генерируется в случае, если приложение, за которым осуществляется мониторинг, не запущено. | Для устранения предупреждения необходимо: 1. Убедиться, что мониторинг приложения включен. 2. Убедиться, что приложение запущено. 3. Убедиться, что предупреждение исчезло. |
2 | Network interface "<iface_name>" is down | host::network::interface | critical | Данное предупреждение генерируется в случае, если сетевой интерфейс, за которым осуществляется мониторинг, недоступен. | Для устранения предупреждения необходимо: 1. Убедиться, что сетевой интерфейс недоступен. 2. Проверить нет ли проблем с сетью. Обратиться к администраторам сети. 3. Если используется Keepalived, убедиться, что он запущен командой из под консоли Linux ps aux / grep keepalived и правильно сконфигурирован. 4. Убедиться, что предупреждения исчезло. |
3 | Disk almost full: <number>% | host::disks | warning, major, critical | Данное предупреждение генерируется в случае, если дисковый раздел заполнен до определенного уровня. Поддерживается 3 уровня: warning, major и critical. Для каждого уровня формируется предупреждение с соответствующим "severity". | Для устранения предупреждения необходимо: 1. Проверить файлы, занимающие много емкости, при необходимости удалить их. 2. Убедиться, что предупреждения исчезло. |
4 | The time on node <node_name> out of sync with host "<host_name>" on <number> ms. | ecss::node::time | major,critical | Данное предупреждение генерируется в случае, если время на наблюдаемой ноде и на хостовой машине расходятся на значение, больше заданной границы. | Для устранения предупреждения необходимо проверить работу NTP-сервера: 1. Проверить, запущен ли процесс ntp, командой из под консоли Linux ps aux grep / ntpили проверить статус сервиса командой sudo service ntp status. 2. Если сервис не запущен, запустить его командой из под консоли Linux: sudo service ntp start. 3. Если сервис запущен, проверить: 3.1. Выполняются ли обновления сервера можно командой из под консоли Linux: ntpq -p -n. 3.2. Вручную синхронизировать время. Для этого остановить сервис командой из под консоли Linux: sudo service ntp stop. Выполнить ручную синхронизацию командой: sudo ntpdate <ntp_server_ip>. Запустить сервис командой: sudo service ntp start. 3.3. Понаблюдать за расхождением во времени. Если проблема опять повториться следует изучить сообщения системного журнала, проверить конфигурационный файл NTP-сервера, возможно добавить в список еще один сервер синхронизации. 4. Убедиться, что предупреждение исчезло. |