Общее описание

Мониторинг событий доступа расположен в разделе Мониторинг системы. На данный момент доступен мониторинг для:

Возможна отправка событий в формате CEF внутри Syslog сообщений на сторонний сервер. Настройка находиться в разделе Мониторинг → Система → Маршруты событий. Подробнее о работе функционала можно ознакомиться на странице v1.0_4.10 Настройка маршрутов событий для интеграции с SIEM (с примером настройки приема событий в rsyslog).

Информацию о работе с мониторингом можно получить во встроенной документации при нажатии кнопки внизу слева.

Подробнее со встроенной документацией можно ознакомиться на странице v1.0_5. Встроенная документация.

Метрики prometheus

Для сервисов NAICE поддержана возможность получения метрик работы в формате Prometheus (подробнее о данном типе метрик можно узнать на сайте продукта https://prometheus.io).

В таблице приведены доступные адреса метрик Prometheus для всех сервисов.  

СервисАдрес метрики
naice-aquilahttp://<IP-адрес хоста NAICE>:8091/actuator/prometheus
naice-bubohttp://<IP-адрес хоста NAICE>:8093/actuator/prometheus
naice-castorhttps://<IP-адрес хоста NAICE>:8095/actuator/prometheus
naice-gaviahttps://<IP-адрес хоста NAICE>:8080/actuator/prometheus
naice-gulohttp://<IP-адрес хоста NAICE>:8089/actuator/prometheus
naice-lemmushttps://<IP-адрес хоста NAICE>:8083/actuator/prometheus
naice-lepushttp://<IP-адрес хоста NAICE>:8087/actuator/prometheus
naice-mustelahttp://<IP-адрес хоста NAICE>:8070/actuator/prometheus
naice-ovishttp://<IP-адрес хоста NAICE>:8084/actuator/prometheus
naice-radiushttp://<IP-адрес хоста NAICE>:9812/metrics
naice-ursushttp://<IP-адрес хоста NAICE>:8081/actuator/prometheus
naice-vulpushttp://<IP-адрес хоста NAICE>:8086/actuator/prometheus


Далее будет приведен список метрик, по которым можно судить о том, как предоставляются различные услуги NAICE.

Название метрикиРасшифровкаПримечания

Метрики событий доступа по протоколу RADIUS (naice-ovis)

Приведены ключевые метрики сервиса naice-ovis, связанные с процессами аутентификации и авторизации по протоколу RADIUS. Часть метрик создается динамически, т.е. они появляются только после первого ее использования.

radius_authenticate_total_success_number_totalОбщее количество успешных аутентификаций пользователей.
radius_authenticate_total_failed_numberКоличество неуспешных аутентификаций для  разных типов источников.

radius_authorization_success_number_total

Общее количество успешных авторизаций.


radius_authorization_failed_number_total

Общее количество неуспешных авторизаций.


radius_authentications_success_numberОбщее количество успешных аутентификаций по определенному источнику.
radius_authenticate_failed_numberОбщее количество неуспешных аутентификаций по определенному источнику.
radius_authenticate_user_timerВремя аутентификации пользователя по определенному источнику.
radius_authenticate_find_user_timerВремя поиска пользователя в источнике.
auth_process_time_seconds

Время обработки аутентификации Netlogon.


auth_successful_count_total

Количество успешных аутентификаций через MS AD.


auth_failed_count_total

Количество неудачных аутентификаций через MS AD.


auth_timeout_count_total

Количество ошибок тайм-аута аутентификации через MS AD.


Метрики событий доступа по протоколу RADIUS (naice-radius)

Экспортером метрик для сервиса naice-radius выступает eltex-radius-exporter, основанный на сервисе экспорта метрик freeradius freeradius-exporter. Он встроен в образ naice-radius и не требует отдельной установки.

Приведены ключевые метрики naice-radius, связанные с обработкой запросов аутентификации.

freeradius_total_access_requestsОбщее количество запросов на аутентификацию (Access-Request).
freeradius_total_access_acceptsКоличество успешных аутентификаций (Access-Accept).
freeradius_total_access_rejectsКоличество неуспешных аутентификаций (Access-Reject).
freeradius_total_access_challengesКоличество запросов, где сервер попросил у клиента дополнительное подтверждение (Access-Challenge).Используется только при многоэтапных схемах аутентификации (PEAP, EAP-TLS).
freeradius_total_auth_invalid_requestsКоличество запросов аутентификации с некорректными данными.
freeradius_total_auth_malformed_requestsКоличество запросов, которые сервер не смог разобрать из-за повреждения или неправильного формата.
freeradius_total_auth_dropped_requestsКоличество запросов, которые были проигнорированы - сервер получил запрос, но не ответил.

Метрика доступности сервиса

freeradius_up

Показатель работоспособности сервиса

1 соответствует работоспособному состоянию, сервис отвечает на запросы Status-Server

0 показывает что сервис не отвечает на запросы Status-Server

Метрики событий доступа портальной авторизации (naice-castor)

Приведены ключевые метрики сервиса naice-castor, отвечающего за аутентификацию пользователей портала, проверку CAPTCHA, отправку SMS-сообщений и выполнение запросов CoA. Часть метрик создается динамически, т.е. они появляются только после первого ее использования.

portal_authentifications_started_number_total

Общее количество начатых аутентификаций.

Зависит от настроенного источника (MS AD, LDAP, LOCAL).
portal_authentifications_success_number_total

Общее количество успешно завершённых аутентификаций.

Отдельно учитываются по каждому источнику.
portal_authentifications_failed_number_total

Общее количество неудачно завершённых аутентификаций.

Отдельно учитываются по каждому источнику.
portal_authentification_time_seconds

Время прохождения аутентификации.

Отдельно учитываются по каждому источнику.
portal_coa_requests_started_number_total

Количество начатых CoA запросов.


portal_coa_requests_success_number_total

Количество успешных CoA запросов.


portal_coa_requests_failed_number_total

Количество неуспешных CoA запросов.


portal_coa_request_time_seconds

Время прохождения CoA запроса.


portal_captcha_generations_number_total

Количество генераций captcha.


portal_captcha_verifications_success_number_total

Количество успешно пройденных проверок captcha.


portal_captcha_verifications_failed_number_total

Количество проваленных проверок captcha.


portal_send_sms_messages_success_number_total

Число отправленных смс.


portal_send_sms_messages_failed_number_total

Число неотправленных смс.


portal_user_sessions_number_total

Количество открытий портала пользователем.


Метрики событий доступа по протоколу TACACS+ (naice-aquila)

Приведены ключевые метрики сервиса naice-aquila, связанные с обработкой TACACS-запросов.

tacacs_requests_any_counter_total

Общее количество любых запросов на порт TACACS сервера.


tacacs_reply_any_total

Количество всех ответов TACACS.


tacacs_reply_pass_total

Количество положительных ответов TACACS.


tacacs_reply_fail_total

Количество отрицательных ответов TACACS.


tacacs_reply_other_total

Количество иных (GETPASS, GETUSER...) ответов TACACS.


tacacs_reply_license_error_total

Количество отрицательных ответов TACACS из-за проблем с лицензией.


tacacs_requests_invalid_counter_total

Количество TACACS запросов, которые были отклонены, так как их невозможно обработать.

Например запросы с некорректным секретом TACACS, или запросы с переполненным seqNum.
tacacs_requests_malformed_counter_total

Количество TACACS запросов, которые не удалось определить по протоколу TACACS.


tacacs_requests_unknown_device_counter_total

Количество TACACS запросов от неизвестных сетевых устройств.


tacacs_authenticate_password_incorrect_counter_total

Количество аутентификаций с неверным паролем.


tacacs_authenticate_user_not_found_counter_total

Количество аутентификаций с несуществующим, ни в одном из источников, пользователем.


tacacs_authenticate_ldap_error_counter_total

Количество ошибок доступа по ldap при аутентификации пользователя из LDAP.


tacacs_authenticate_ldap_timeout_counter_total

Количество таймаутов доступа по ldap при аутентификации пользователя из LDAP.


tacacs_authenticate_ms_ad_error_counter_total

Количество ошибок доступа по ldap при аутентификации пользователя из MS AD.


tacacs_authenticate_ms_ad_timeout_counter_total

Количество таймаутов доступа по ldap при аутентификации пользователя из MS AD.


tacacs_authorize_command_fail_counter_total

Количество неудачных авторизаций команд.


tacacs_reply_authenticate_fail_totalКоличество отрицательных ответов аутентификации.
tacacs_reply_authorize_fail_total

Количество отрицательных ответов авторизации TACACS.


tacacs_user_found_local_counter_total

Счётчик успешного нахождения пользователя локально.


tacacs_user_found_ldap_counter_totalСчётчик успешного нахождения пользователя LDAP.
tacacs_user_found_ms_ad_counter_totalСчётчик успешного нахождения пользователя MS AD.

Метрики уведомлений (naice-bubo)

Приведены ключевые метрики сервиса отправки уведомлений

gateway_request_time_seconds

Распределение времени выполнения запросов к шлюзу с учётом статуса

Тэг status - failed, success

Квантили 0.5, 0.95, 0.99

gateway_request_time_seconds_count

.. количество значений


gateway_request_time_seconds_sum

.. сумма всех значений


gateway_request_time_seconds_max

.. максимальное значение
notification_send_timeРаспределение времени отправки уведомлений с учётом статуса

Тэг status - failed, success

Квантили 0.5, 0.95, 0.99

notification_send_time_count.. количество значений
notification_send_time_sum.. сумма всех значений
notification_send_time_max.. максимальное значение
notification_success_numberЧисло успешно отправленных уведомлений по типамТэг type - production, test
notification_failed_numberЧисло не удачно отправленных уведомлений по каждому типу ошибкиТэг error_type
notification_template_errorsЧисло ошибок шаблонизации
notification_validation_errorsЧисло ошибок валидации

Метрики API (naice-gavia)

Приведены ключевые метрики сервиса API gateway

cert_valid_from

Дата начала срока действия SSL-сертификата в миллисекундах


cert_valid_to

Дата окончания срока действия SSL-сертификата в миллисекундах


ssl_chain_expiry_seconds

Количеству секунд, оставшихся до истечения срока действия SSL-сертификата с самой ранней датой истечения срока действия в цепочке сертификатов.


Метрики лицензирования (naice-gulo)

Приведены ключевые метрики сервиса лицензирования

license_elm_available

Текущий статус доступности ELM


license_elm_expired_date

Дата окончания действия лицензии


license_endpoints_max_size

Лимит эндпойнтов установленный в действующей лицензии


Метрики аутентификации (naice-lemmus)

Приведены ключевые метрики сервиса аутентификации API

cert_valid_from

Дата начала срока действия SSL-сертификата в миллисекундах


cert_valid_to

Дата окончания срока действия SSL-сертификата в миллисекундах


ssl_chain_expiry_seconds

Количеству секунд, оставшихся до истечения срока действия SSL-сертификата с самой ранней датой истечения срока действия в цепочке сертификатов.


Метрики сбора проб профилирования (naice-lepus)

Приведены ключевые метрики сервиса сбора проб профилирования

dhcp_probes_buffer_cache_size_gauge

Текущий размер кэша профилируемых клиентов (изученых MAC адресов)


dhcp_probes_journal_requests_seconds

Распределение времени обработки входящих DHCP пакетов, помещение их в кэшКвантили 0.5, 0.75, 0.95

dhcp_probes_journal_requests_seconds_count

.. количество значений

dhcp_probes_journal_requests_seconds_sum

.. сумма всех значений

dhcp_probes_journal_requests_seconds_max

.. максимальное значение

dhcp_probes_process_requests_seconds

Распределение времени сохранения информации из кэша в базу данныхКвантили 0.5, 0.75, 0.95

dhcp_probes_process_requests_seconds_count

.. количество значений

dhcp_probes_process_requests_seconds_sum

.. сумма всех значений

dhcp_probes_process_requests_seconds_max

.. максимальное значение

dhcp_probes_requests_total

Число обработанных DHCP пакетов по типамТэг msgType - DHCP_DISCOVER, DHCP_REQUEST

Метрики обработки событий (naice-mustela)

Приведены ключевые метрики сервиса обработки событий

naice_siem_events_sent_total

Основная метрика: Общее количество успешно отправленных событий в SIEM по каждому протоколу, коллектору

Тэги protocol, siem_route
naice_siem_events_failed_total

Общее количество неудачных попыток отправки событий в SIEM по каждому протоколу, коллектору и типу ошибки

Тэги protocol, siem_route, error_type
naice_siem_events_duration_seconds

Распределение времени отправки события в SIEM по каждому протоколу, коллектору и статусу

Квантили 0.5, 0.95, 0.99

Тэги protocol, siem_route, status

naice_siem_events_duration_seconds_count.. количество значений


naice_siem_events_duration_seconds_sum.. сумма всех значений


naice_siem_events_duration_seconds_max.. максимальное значение


naice_siem_connection_active_count

Текущее количество активных TCP-соединений с SIEM


Метрики naice-ursus

Приведены ключевые метрики сервиса работы с базой данных

tasks_scheduled_execution_seconds_count

Общее число срабатываний фоновых процессов, среди которых (code_namespace):

  • OuiLoader - обновления базы MAC адресов (OUI)
  • GuestEndpointCleaner - очистка суточного кэша эндпойнтов
  • LogicalConditionService - очистка устаревших условий из БД

tasks_scheduled_execution_seconds_sum

Общее время работы этих фоновых процессов.