Дерево страниц
Перейти к концу метаданных
Переход к началу метаданных

Управление отказами (Fault Management) — комплексный подход к обнаружению и решению проблем, зарегистрированных на сети.

Ниже представлена иллюстрация принципа работы системы управления отказами.

Основная идея реализованного в ECCM подхода состоит в том, чтобы агрегировать события, зарегистрированные в различных источниках, в единый журнал, подходящий для дальнейшего анализа. Далее зарегистрированные события обрабатываются: система проверяет, какие события и с какой периодичностью происходили в сети. На основе проведенного анализа формируется вывод о возможности возникновения проблем. Сведения о проблемах записываются в журнал. Пользователям системы, которые подписались на рассылку уведомлений, на указанный канал связи отправляется уведомление о зарегистрированной проблеме.

Таким образом, алгоритм работы включает несколько этапов:

  1. Сбор первоначальных данных и сохранение их в базе данных;
  2. Проверка первоначальных данных по условиям, прописанным в правилах генерации событий. Запись зарегистрированных событий в журнал событий;
  3. Обнаружение проблем: анализ последовательностей событий по условиям, прописанным в правилах генерации проблем. Запись обнаруженных проблем в журнал проблем;
  4. Рассылка оповещений о проблемах пользователям.
  5. Ожидание действия от пользователей.
  • Нет меток