Дерево страниц

Сравнение версий

Ключ

  • Эта строка добавлена.
  • Эта строка удалена.
  • Изменено форматирование.

Таблица - Описание предупреждений подсистемы RPS

ПредупреждениеКлассВажностьОписаниеДействия оператора для устранения предупреждения
1Application <app_name> is not runninghost::applicationcriticalДанное предупреждение генерируется в случае, если приложение, за которым осуществляется мониторинг, не запущено.Для устранения предупреждения необходимо:
1. Убедиться, что мониторинг приложения включен.
2. Убедиться, что приложение запущено.
3. Убедиться, что предупреждение исчезло.
2Network interface "<iface_name>" is downhost::network::interfacecriticalДанное предупреждение генерируется в случае, если сетевой интерфейс, за которым осуществляется мониторинг, недоступен.Для устранения предупреждения необходимо:
1. Убедиться, что сетевой интерфейс недоступен.
2. Проверить нет ли проблем с сетью. Обратиться к администраторам сети.
3. Если используется Keepalived, убедиться, что он запущен командой из под консоли Linux ps aux / grep keepalived и правильно сконфигурирован.
4. Убедиться, что предупреждения исчезло.
3Disk almost full: <number>%host::diskswarning, major, criticalДанное предупреждение генерируется в случае, если дисковый раздел
заполнен до определенного уровня. Поддерживается 3 уровня: warning, major и 
critical. Для каждого уровня формируется предупреждение с соответствующим "severity".
Для устранения предупреждения необходимо:
1. Проверить файлы, занимающие много емкости, при необходимости удалить их.
2. Убедиться, что предупреждения исчезло.
4The time on node <node_name> out of sync with host "<host_name>" on <number> ms.ecss::node::timemajor,criticalДанное предупреждение генерируется в случае, если время на наблюдаемой ноде и на хостовой машине расходятся на значение, больше заданной границы.Для устранения предупреждения необходимо проверить работу NTP-сервера:
1. Проверить, запущен ли процесс ntp, командой из под консоли Linux ps aux grep / ntpили проверить статус сервиса командой sudo service ntp status.
2. Если сервис не запущен, запустить его командой из под консоли Linux: sudo service ntp start.
3. Если сервис запущен, проверить:
3.1. Выполняются ли обновления сервера можно командой из под консоли Linux: ntpq -p -n.
3.2. Вручную синхронизировать время. Для этого остановить сервис командой из под консоли Linux: sudo service ntp stop. Выполнить ручную синхронизацию командой: sudo ntpdate <ntp_server_ip>. Запустить сервис командой: sudo service ntp start.
3.3. Понаблюдать за расхождением во времени. Если проблема опять повториться следует изучить сообщения системного журнала, проверить конфигурационный файл NTP-сервера, возможно добавить в список еще один сервер синхронизации.
4. Убедиться, что предупреждение исчезло.