Управление отказами (Fault Management) — комплексный подход к обнаружению и решению проблем, зарегистрированных на сети.

Ниже представлена иллюстрация принципа работы системы управления отказами.

Основная идея реализованного в ECCM подхода состоит в том, чтобы агрегировать события, зарегистрированные в различных источниках, в единый журнал, подходящий для дальнейшего анализа. Далее зарегистрированные системные события обрабатываются: система проверяет, какие системные события и с какой периодичностью происходили в сети. На основе проведенного анализа формируется вывод о возможности возникновения проблем. Сведения о проблемах записываются в журнал. Пользователям системы, которые подписались на рассылку уведомлений, на указанный канал связи отправляется уведомление о зарегистрированной проблеме.

Таким образом, алгоритм работы включает несколько этапов:

  1. Сбор первоначальных данных и сохранение их в базе данных. Проверка полученных с устройства логов WLC и регистрация по ним wireless-событий;
  2. Проверка первоначальных данных по условиям, прописанным в правилах генерации событий. Запись зарегистрированных событий в журнал системных событий;
  3. Обнаружение проблем: анализ последовательностей событий по условиям, прописанным в правилах генерации проблем. Запись обнаруженных проблем в журнал проблем;
  4. Рассылка оповещений о проблемах пользователям;
  5. Ожидание действия от пользователей.
  • Нет меток