Page tree
Skip to end of metadata
Go to start of metadata

<div class="aui-message error aui-message-error">
<p class="title">
<span class="aui-icon icon-error"></span>
<strong>Comala Metadata License Details</strong>
</p>
<p>Invalid commercial evaluation license with a expired error. Please click <a href="https://marketplace.atlassian.com/plugins/org.andya.confluence.plugins.metadata" target="_blank">here</a> to purchase a commercial license.</p>
</div>

Конфигурационные файлы

/usr/lib/eltex-ems/conf/config.txt

Файл содержит настройки пулов для подключения к базам данных. Для примера рассмотрим настройку пула для подключения к БД 'eltex_ems' и 'radius':

# DB Tree
poolName2=tree
tree.jdbc.driver=org.gjt.mm.mysql.Driver
tree.jdbc.dbUrl=jdbc:mysql://localhost/eltex_ems?useUnicode=true&characterEncoding=utf8&relaxAutoCommit=true&connectTimeout=5000&noAccessToProcedureBodies=true
tree.jdbc.username=javauser
tree.jdbc.password=javapassword
tree.jdbc.maxPoolSize=48
tree.jdbc.inUse=yes

# DB  radius(alias=radius)
poolName9=radius
radius.jdbc.driver=org.gjt.mm.mysql.Driver
radius.jdbc.dbUrl=jdbc:mysql://localhost/radius?useUnicode=true&characterEncoding=utf8&relaxAutoCommit=true&connectTimeout=5000
radius.jdbc.username=javauser
radius.jdbc.password=javapassword
radius.jdbc.maxPoolSize=40
radius.jdbc.inUse=yes
# remote db host access with su privileges
# radius.ssh.login=
# radius.ssh.password=
# radius.ssh.port=

Параметры на которые нужно обратить внимание:

poolName - название коннекта к базе данных в интерпретации сервера EMS.

radius.jdbc.dbUrl - адрес для подключения к базе данных.

radius.jdbc.username - логин для подключения к базе данных.

radius.jdbc.password - пароль для подключения к базе данных.

radius.jdbc.maxPoolSize - количество коннектов, которые сервер EMS может открыть для подключения к БД. Необходимое количество коннектов зависит от нагрузки на сервер, таблица для расчета приведена в настройках базы данных MySQL. Если не планируется поддержка устройств ONT или CPE, то количество коннектов для пулов ont, cpe, cmds, inf, cache следует установить равным 0.

Группа настроек для подключения к серверу БД по ssh приведена для того, чтобы сервер EMS имел возможность выгружать некоторые дампы и файлы непосредственно с сервера БД.

/usr/lib/eltex-ems/conf/log4j2.xml

Конфигурация логгера EMS сервера. Файлы логов сервера EMS ограничиваются по размеру,

    <properties>
        <property name="basedir">/var/log/eltex-ems</property>
        <property name="maxSize">20 MB</property>
        <property name="maxCount">20</property>
        <property name="defaultPattern">%d{ISO8601} [%t] %-5p %logger{12} %x %C{1}.%M(line:%L). %m%n</property>
        <property name="monitorPattern">%d{ISO8601} [%t] %-5p %logger{12} %C{1}.%M(line:%L). %m%n</property>
    </properties>


basedir - основная директория для хранения лог-файлов.

maxSize - максимальный размер логфайла. При превышении этого размера лог-файл архивируется и начинает записываться новый.

maxCount - количество хранимых архивов лог-фалов (за день).


/usr/lib/eltex-ems/conf/system-config.txt

Файл содержит дефолтные настройки системы, которые используются при первой загрузке. В последствии некоторые параметры могут быть изменены из GUI EMS, однако настройки подключения можно изменить только в этом файле:

# server socket and socket handlers pool
gui.port=9310
gui.handler_pool_size=200
gui.connection.timeout.sec=300

gui.port - порт, который будет прослушиваться сервером для подключения GUI пользователей (используется для передачи данных в апплет пользователя).

gui.handler_pool_size - пул обработчиков пользовательских подключений.

gui.connection.timeout.sec - таймаут ожидания ответа от пользователя до разрыва соединения.


/etc/eltex-ems/gui.conf

Файл конфигурации пользовательского апплета.

log.level=INFO

ping.period=10
socket.timeout=300
#socket.port=9310

java.max_heap=700m
java.init_heap=250m

log.level - Уровень логирования в GUI : DEBUG, INFO, WARN, SEVERE, ERROR, FATAL. Логи сохраняются на компьютере пользователя, для windows путь хранения C:\Users\<UserName>\ems_log\.

socket.timeout - таймаут ожидания ответа от пользователя до разрыва соединения.

socket.port - порт, на который будет обращаться пользовательский апплет для получения данных от сервера. По умолчанию (если закомментирован) равен порту, который прослушивается сервером.

java.max_heap - ограничение на максимальное количество памяти, которое апплет будет занимать на ПК пользователя.

java.init_heap - количество памяти, которое апплет попытается занять при старте работы.

/etc/eltex-ems/check-ems-replication.conf

Конфигурация для проверки состояния репликации на серверах БД MySQL.

ENABLE_REPLICATION="No"

HOST1=192.168.56.100
HOST2=192.168.56.101

USER="root"
PASSWORD="root"

ENABLE_REPLICATION - статус проверки. "Yes" - проверка включена, "No" - выключена.

HOST1, HOST2 - адреса серверов БД

USER, PASSWORD - логин и пароль для подключения к консоли MySQL. Должны быть одинаковыми на обоих серверах и иметь привилегии для проверки статуса репликации.

/etc/default/eltex-ems

Файл содержит параметры запуска процесса eltex-ems.

# Location of java
JAVA=/usr/bin/java

# Maximum size of Java heap
JAVA_MAX_HEAP_MB=1576
# Initial size of Java heap
JAVA_INIT_HEAP_MB=256

# Options for Java Garbage Collector
GC_OPTS="-XX:+UseParallelGC -XX:MaxPermSize=512m -XX:PermSize=200m"

# Additional arguments to pass to java
JAVA_OPTS="-XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=/var/log/eltex-ems -Djava.security.egd=file:/dev/./urandom"

# Eltex.EMS home location
ELTEX_EMS_HOME="/usr/lib/eltex-ems"

# Set it more than (EMS tree objects number * 5)
FILE_LIMIT=16384

JAVA - расположение java-машины.

JAVA_MAX_HEAP_MB - максимальное количество памяти, которое будет забирать сервер EMS на свою работу. Если памяти не хватает, возможны ошибки типа OutOfMemory.

JAVA_INIT_HEAP_MB - количество памяти с которым стартует сервер EMS.

GC_OPTS - опции запуска сборщика мусора.

JAVA_OPTS - дополнительные опции запуске EMS сервера.

ELTEX_EMS_HOME - каталог с системными файлами EMS сервера.

FILE_LIMIT - ограничение на количество открываемых файлов. Устанавливается из расчете количество объектов в дереве умноженное на 5. При недостатке возможны перебои в работе сервера с ошибками вида 'java.io.IOException: Too many open files'.

/etc/hosts

Файл содержит соответсвие между именем хоста и ip адресом.

127.0.0.1 localhost
127.0.1.1 ubuntu

127.0.0.1 localhost - стандартное зарезервированное доменное имя для подсети 127.0.0.0/8.

127.0.1.1 <имя хоста> - имя хоста, которое можно узнать командой hostname. Для корретной работы требуется возможность получить ip адрес по имени хоста.



Меню Администрирование в GUI EMS

Права и пользователи

Настройка ролей пользователей

В качестве базового принципа разделения прав используется механизм ролей. Роль — это логическая сущность, которая содержит в себе следующие данные:

  • Имя роли;
  • Текстовое описание;
  • Время бездействия (сек);
  • Список разрешённых действий с объектами:
  • Список разрешённых узлов и объектов;
  • Параметры регистрации на аварии:
    • Информационные (Info);
    • Предупреждения (Warning);
    • Не важные (Minor);
    • Важные (Major);
    • Критические (Critical).

В системе присутствует одна базовая роль администратора, которая называется «SuperUser». Эту роль запрещено редактировать. Она автоматически имеет все права на все объекты.

Все прочие роли настраиваются администратором, согласно должностным обязанностям операторов и логической разбивке по устройствам или территориальному принципу. 

Настройка ролей и пользователей доступна для пользователей системы с правами «Редактировать права и роли». Добавление и редактирование ролей производится путём вызова пункта меню «Администрирование/Права и пользователи/Настройка ролей пользователей». При выборе этого пункта меню программа выдаст диалог, в котором можно редактировать роли (кроме системных ролей «SuperUser» и «NorthBound»), а также добавлять и удалять роли.

Есть возможность настройки времени бездействия для роли – это время в секундах, начиная с последней операции, выполненной пользователем с данной ролью, по истечении которого сессия будет завершена. Для задания бесконечного времени бездействия используется значение «0».

Для каждой роли существует перечень разрешений, который можно изменить, перейдя в меню «Редактировать привилегии».Привилегии сгруппированы в разделы по основным модулям. Все действия по настройке системы управления собраны в разделе «system». Настройка прав на действия с устройствами wireless и конфигурирование основных параметров ТД производится во вкладке «Wireless Common». Для каждой привилегии есть возможность просмотра расположения акций, входящих в состав данной привилегии (кнопка  слева от привилегии).

Список и описание привилегий в приложении v1.16_Привилегии пользователей EMS


  

В настройке роли в разделе «Регистрация на аварии» указываются уровни аварий, которые необходимо отправлять пользователю с данной ролью, подписанному на отправку аварий на почту (E-mail).


Для каждой роли, помимо закреплённых за ней прав, необходимо также задать и область действия этих прав. Для разграничения по группам объектов и узлов можно использовать настройку списка разрешенных объектов либо домен. Настройка производится в разделе "Системные модули", параметр "Тип доступа к устройствам системы". 

При выборе типа доступа пользователей по ролям при редактировании роли необходимо отметить флагом «Разрешить»соответствующие узлы в правой части диалога настройки роли. При разрешении доступа к узлу для данной роли происходит автоматическое разрешение на все вложенные узлы и объекты. Для конфигурирования полного доступа к дереву необходимо выдать разрешение на корневой узел «RootNode».



Настройка пользователей системы



Пользователь системы — это логическая сущность, предназначенная для авторизации входа в систему. Каждый пользователь имеет следующий набор параметров:


Добавление и редактирование

При создании нового пользователя обязательно заполнение полей 'Имя', 'Пароль' ('Подтверждение'), которые  требуются для каждого входа в систему (авторизация), а так же 'Роль', которая определяет перечень разрешённых действий. Дата окончания действия учётной записи регулирует время действия записи и проверяется при каждой авторизации, автоматически устанавливается в один год.

Добавление и редактирование пользователей производится путём вызова пункта меню «Администрирование/Права и пользователи/Настройка пользователей системы». При выборе этого пункта меню программа выдаст диалог, в котором можно редактировать пользователей. Системный пользователь с именем «admin» не может быть удалён или переименован. Также для него нельзя поменять дату окончания срока действия прав и сменить роль. Для прочих пользователей можно задавать следующие параметры:

  • Имя — произвольное имя до 32 символов;
  • Описание — произвольное описание до 64 символов;
  • Роль — роль, определяющая права доступа;
  • Пароль — произвольный цифробуквенный пароль;
  • Подтверждение — подтверждение пароля;
  • Дата – дата окончания действия учетной записи пользователя;
  • E-mail – адрес электронной почты для отправки сообщений об авариях;
  • Пересылать аварии на e-mail – при установленном флаге отправлять аварийные сообщения на указанный адрес, иначе – не отправлять (активация и настройка сервиса отправки сообщений на E-mail производится для модуля system, на вкладке Администрирование/Настройка сервера/Системные модули);
  • Пересылать архив логов на e-mail – при установленном флаге отправлять архив лог-файлов на указанный адрес, иначе – не отправлять (подробная настройка монитора описана в разделе Приложение А. п.4 Настройка мониторов);
  • Проблемы ONT на e-mail – при установленном флаге отправлять сообщения на указанный адрес, иначе – не отправлять (подробная настройка монитора описана в разделе Приложение А. п.4 Настройка мониторов);
  • Блокировка – при установленном флаге система блокирует вход для пользователей с текущим именем;
  • Multiuser – режим, позволяющий нескольким пользователям авторизоваться под одним логином. В данном режиме для пользователя прописываются допустимые IP-адреса (ПК GUI). Для указания подсети адресов необходимо воспользоваться символом «» (192.168.0. соответствует сети адресов 192.168.0.0/24). Адреса разделяются пробелом или запятой. Диапазоны адресов указываются в формате: ... или A...* или A.B.. или A.B.C.*. Адреса не валидируются. Максимальный размер поля – 255 символов. Если пользователь авторизуется с одного из допустимых IP-адресов, то пароль не запрашивается.

При отсутствии таблицы базы данных, отвечающей за списки адресов, данный режим считается выключенным.
Пароль не хранится в чистом виде в системе, поэтому администратор системы не сможет сообщить эту информацию.
Флаг «Изменить» рядом с полем «Пароль» предназначен для того, чтобы была возможность заново задавать пароли. В случае если необходимо изменить пароль (или задать его в первый раз), нужно включить флаг и заполнить поле «Пароль». Иначе при изменении прочих параметров, но не активном флаге, изменение пароля не производится. Функция реализована для того, чтобы администратор системы не вводил пароль пользователя при прочих изменениях его данных. Пароль по умолчанию для учётной записи «admin» - пароль пустой.
После окончания срока действия учётной записи пользователя система блокирует вход с этим именем. Администратор системы может продлить время действия или удалить учётную запись.

Домены

Домены – абстрактные сущности, включающие в себя сквозные идентификаторы, посредством которых осуществляется связь системы SoftWLC.

Доступность для управления и мониторинга узлов (групп) точек доступа или единичных точек доступа определяется доменом. В случае если домен, указанный в роли, совпадает с доменом группы или точки доступа, то пользователь SoftWLC, которому присвоена данная роль, будет обладать правами работы с точкой доступа или группой точек доступа. Также Пользователь сможет иметь права на управление ТД или группой, если его домен находится на уровень выше, но при этом совпадает на аналогичном уровне с доменом ТД или группы.


Параметры доменов

Типы доменов

Возможности системы позволяют создавать SSID с любым доменом на любой точке доступа. Таким образом можно организовывать общую Wi-Fi сеть в различных регионах, при этом пользователь с одной и той же учетной записью сможет авторизоваться на всей этой сети. В связи с этим возникает необходимость в создании отдельных веток доменов для точек доступа и для SSID (а также пользователей, потому что их домены совпадают). Для такого разделения в систему была добавлена типизация доменов:

'ap' - домены, предназначенные для работы с точками доступа. При создании такого домена в дереве объектов автоматически создается узел, в который могут быть помещены новые точки доступа.

'service' - предназначены для использования в настройках SSID, учетных записей пользователей, виртуальных порталов и других сервисных объектов.

'both' - универсальный тип, объединяет в себе все функции. Используется в схемах. где отсутствует необходимость в разделении доменов по типам.

Если тип домена не указан, то он наследуется из родительского домена, вплоть до корневого. Если у корневого домена отсутствует тип, то он считается за тип 'both'.


Максимальное число пользователей Wi-Fi

Ограничение на количество пользователей, которых можно создать в этом домене. По умолчанию не устанавливается.

Сумма пользователей в дочерних доменах не может превышать количество пользователей в родительском домене.


Регион

Цифровое обозначение субъекта РФ. Параметр используется для работы СОРМ. этот параметр может наследоваться из родительского домена, вплоть до корневого. Дефолтного значения для этого параметра нет, поэтому если в корневом домене не указан номер региона, то параметр не сможет быть унаследован.


Часовой пояс

Обозначение часового пояса для данного домена.Параметр необходим для поддержки сервисов, работающих по расписанию. Например отображение портала в зависимости от времени.

Если параметр не указан в домене, то он наследуется из родительского, вплоть до корневого. Если параметр не указан в корневом домене, то используется часовой пояс сервера.

Для большей однозначности, рекомендуется использовать таймзны вида Asia/Novosibirsk, Europe/Moscow.

Область "Etc" в наименовании таймзоны имеет особое значение, смещение в ней считается так: зоны западнее GMT имеют положительный сдвиг, а зоны восточнее - отрицательный. Таким образом зона Etc/GTM-7 соответствует UTC+7 (GMT+7) или Asia/Novosibirsk


Создание/редактирование доменов

Для создания и редактирования доменов используется схожий интерфейс диалогового окна.

При создании нового домена обязательным параметром является только название домена, остальные параметры могут быть унаследованы от родительского домена.

Начиная с версии 1.10 (EMS 3.14) наименование домена редактировать запрещено. Возможно только полностью удалить домен и создать заново с новым именем.


Удаление

Начиная с версии 1.9 (EMS 3.13) удаление домена доступно только пользователям с привилегией SuperUser. Это сделано с целью обезопасить от случайных либо ошибочных удалений, ввиду того, что начиная с этой версии удаление домена включает в себя удаление и всего содержимого этого домена.


При удалении домена, система проверяет. используется ли домен где-либо в системе. Если он задействован, то пользователю будет выведено предупреждение об удалении со списком всех сущностей этого домена (SSID, пользователи, поддомены, тарифные планы и прочее) о невозможности откатить выполнение данной операции.

При нажатии Подтверждаю, в целях безопасности, будет выведена форма ввода пароля учетной записи.

После ввода пароля и нажатия кнопки ОК будет удален домен, со всем содержимым (всё что выведено в предупреждении ранее). Откат этой операции не возможен.


Настройка шейперов трафика по доменам

Интерфейс позволяет настраивать шейпинг трафика на SSID. Работа этого функционала обеспечивается устройством ESR/BRAS, на котором терминируются туннели от точек доступа.

Кроме ограничения по скорости, наличие правила шейпинга требуется для поднятия data туннелей в динамическом режиме. Поэтому, для работы каждого SSID на ESR в режиме BRAS необходимо правило шейпинга.

При создании привязки на точках доступа к домену типа 'ap' или 'both', правило шейпинга создается автоматически, по дефолту в нем нет ограничений по скорости.


Ограничения скорости передачи трафика:

Average upstream bandwidth, kbps - Разрешенная средняя скорость передачи трафика от пользователей.

Peak upstream bandwidth, kbps - Разрешенная пиковая скорость передачи трафика от пользователей.

Average downstream bandwidth, kbps - Разрешенная средняя скорость передачи трафика в сторону пользователей.

Peak downstream bandwidth, kbps - Разрешенная пиковая скорость передачи трафика в сторону пользователей.

Разрешенная пиковая скорость должна быть больше или равно средней скорости.



Настройки сервера

Прием и обработка SNMP трапов

В меню осуществляется настройка приема и обработки SNMP-трапов в системе.

Редактирование доступно по нажатию кнопки «Редактировать» либо двойным щелчком мыши на строке выбранного трапа SNMP.

Для редактирования доступны следующие настройки:

  • Disabled – отбрасывать трап (обработка системой не производится – трап не отсылается на e-mail, не записывается в БД, не меняется оперативный статус устройств и т.д.);
  • Priority – приоритет (отображение сообщения в журналах с данным приоритетом);
  • Always clised – переводить аварию сразу в состояние «Закрыта» (не будет попадать в активные аварии, только в журнал событий, вследствие чего не будет работать звуковая сигнализация);
  • Не хранить в БД – не вносить сообщение в БД (журнал событий) и активные аварии, при этом производить обработку (например, оперативный статус устройства будет меняться, однако записи в журналах не производятся).

По кнопке «Сброс» производится сброс параметров в значения по умолчанию. По кнопке «Черный список» можно настроить для отдельного трапа список устройств, для которых данный трап отбрасывается (аналогично настройке «Disabled»). Для части трапов из списков «ALL», «EMS_SERVER» и «KEEPALIVED» добавление в черный список недоступно, поскольку трапы системные и необходимы для нормальной работы СУ.


Настройка мониторов


Подробное описание системных мониторов приведено в приложении v1.16_Системные мониторы


Системные модули

Здесь содержаться настройки различных модулей, необходимых для работы сервера EMS.

pcrf

Модуль отвечает за взаимодействие с сервисом eltex-pcrf. Настраиваемые параметры:

Статус - включен/выключен.

URL - адрес для подключения к eltex-pcrf.

Таймаут соединения - время ожидания ответа от сервера eltex-pcrf.

Таймаут чтения/записи - время ожидания ответа от сервера eltex-pcrf.



radius

Настройка взаимодействия с сервером RADIUS. Необходимо для проверки состояния и перезапуска RADIUS сервера при обновлении таблицы NAS.

RADIUS service name - названия используемого сервиса. С версии SoftWLC 1.7 используется eltex-radius.

"Secret" for localhost - секретый ключ, котрый будет использовать сервер EMS для проверки состояния сервера RADIUS.

EMS host ip-address as RADIUS client - адрес EMS сервера с которого будет происходит обращение на RADIUS сервер.

Restart timeout - время ожидания подтверждения о выполнении перезапуска RADIUS сервера.

Min. restart interval - интервал между рестартами.



softwlc.nbi

Настройка взаимодействия с SoftWLC.NBI.

Статус - включен/выключен.

URL - ссылка для получения WSDL файла.

Username - логин для подключения к SoftWLC.NBI. 

Password - пароль для подключения к SoftWLC.NBI.

Connection timeout - время ожидания ответа при подключении.

Request timeout - время ожидания ответа при выполнении запроса данных.



system

Раздел содержит настройки работы основного модуля EMS.

Общие настройки
Название параметраОписание
Язык интерфейса и системных сообщенийвыбор языка интерфейса, доступны русский и английский языки.
IP адрес EMS сервера в управляющей сети станцийIP адрес интерфейса, с которого сервер EMS будет обращаться к точкам доступа.
Каталог временных файловадрес хранения временных файлов, создаваемых при работе сервера EMS.
Tomcat URLURL адрес сервера EMS для доступа к нему из внешних сетей. Используется для скачивания данных с сервера на пользовательские ПК по протоколу HTTP.
Внутренний TOMCAT URLURL адрес сервера EMS для доступа к нему из cети управления точками доступа. Используется для обновления прошивок точек доступа по протоколу HTTP.
Каталог общих файловкаталог файлов, создаваемых EMS и требующих хранения, например шаблоны файлов конфигураций.
Каталог временных файлов БДкаталог для хранения временных фалойв, получаемых с БД, например дампов или архивов, которые будут в последствии отправлены на другой сервер.
Уровни логирования работы мониторовглобальная установка уровня логирования мониторов EMS сервера (задачи по расписанию). Доступные значения: DEBUG, INFO, WARN, SEVERE, ERROR, FATAL
Дополнительные команды
Посылать SNMP предзапрос 'Контроль доступности'выполнение проверки доступности устройства перед выполнением операций конфигурирования.
Таймаут операции SNMP предзапросавремя ожидания ответа от устройства при проверке доступности.
Копировать принятые трапы в Syslogкопирование всех принятых сообщений (SNMP trap) в Syslog.
Сохранять дату автоматического закрытие в БДсохранять дату автоматического закрытия аварии  в БД. Если False, дата проставляется только при ручном закрытии.
Размер очереди для менеджера асинхронных задачмаксимальное количество одновременно выполняемых асинхронных задач.
Время хранения записей в списке 'Задачи'максимальное время хранения задач, по истечению которого задачи из списка будут удалены.
Опрос доступности (ICMP, SNMP ping)включение/выключение механизма опроса устройств в дереве объектов.
Период опроса устройства (ICMP, SNMP ping)интервал опроса устройств в дереве объектов. При большом количестве устройств система может не успевать выполнить опрос всех устройств в указанное время, в этом случае при запуске сервера будет отображаться сообщение о необходимости увеличить интвервал.
Размер пула обработчиков опроса доступностиколичество обработчиков, выполняющих опрос устройств в дереве.
Период хранения результатов ICMP, SNMP запросовпериод опроса, который будет хранится в памяти EMS. Более старые данные будут удаляться.
Таймаут проверки GUI сессии в состоянии 'Создана'время проверки сессии после загрузки апплета.
Синхронизировать устройство после восстановления связимеханизм автоматической синхронизации устройств в случае если связь с ним была потеряна на длительное время (равное "Периоду, после которого запустится автосинхронизация"), а потом восстановлена.
Конфигурация устройства после восстановления связимеханизм, выполняющий конфигурирование устройства в соответствии с действующей привязкой инициализации.
Период, после которого запустится автосинхронизацияинтервал времени между событиями потери и восстановления связи к объекту, при превышении которого запускается автоинициализация и конфигурирование.
Режим ACS.GUIрежим работы ACS.
Применять генерацию пользовательских событийвключение функционала позволяющего создавать специальные аварии и события, на основе существующих триггеров.
HTTP таймаутвремя ожидания ответа ответа на запросы по протоколу HTTP.
Тип доступа к устройствам системывыбор механизма определения области видимости объектов системы для пользователей. При использовании доменной системы видимость объекта определяется по совпадению доменов пользователя и объекта. В системе по ролям зоны видимости по узлам в дереве объектов.
Проверять хостнейм для всех устройствфункция проверки hostname у устройств в дереве объектов. В случае если имя объекта в дереве не совпадает с hostname устройство помечается как аварийное.
Включить геоданные объектовдополнительные опции при инициализации точек доступа, включают в себя адрес инсталляции, ФИО сотрудника, номер заявки, географические координаты.
Включить обязательность геоданных объектовПри создании привязок инициализации заполнение геоданных становится обязательным условием.
Настройка геокодеравыбор геокодера для определения географических координат.


airtune

Название параметраОписание
ProtocolНастройка шифрованного соединения с сервисом AirTune
HostАдрес хоста где рассположен AirTune
PortПорт взаимодействия с сервисом AirTune
Timeout, s
Connection

Настройки апплета (GUI)
Название параметраОписание
Заголовок аплетаотображается в заголовке окна.
Скрывать панель "Задачи"при запуске аплета панель с асинхронными задачами будет скрыта.
Отображать кнопку "Помощь" рядом с параметромрядом с параметрами появляется дополнительная кнопка с кратким описанием.
Сохранять значение фильтров поиска при выходе из вкладкисохранение фильтров на вкладках, например на вкладке "Список устройств".
Запоминать ранее выбранную вкладку при переходе к другому объекту
при переходе на устройство будет открыта последняя открытая вкладка для этого типа устройств.
Открывать вкладку 'Активные аварии' при переходе на узелпри переходе на любой узел всегда открывается вкладка Активные аварии
Приоритет аварий для сигнализации в дереве объектовуровень аварии на устройстве, достаточный чтобы попасть в список активных аварий.
Включить модуль мониторинга RRDвключение/отключение модуля мониторинга RRD.
Отображать количество записей в таблицахотображение счетчика числа записей в таблицах. Рекомендуется отключать в высоконагруженных системах.



Настройка подсистемы высылки сообщений из журнала трапов на внешнюю систему
Название параметраОписание
Включить сервисстатус сервиса вкл/выкл.
Включить стартовый трап системы EMSотправка специального трапа при старте сервера EMS.
Тип отправляемого сообщениятип сообщения trap/inform.
Адрес приемникаIP адрес сервера, обрабатывающего сообщения от EMS.
Порт приемникапорт, прослушиваемый сервером-обработчиком.
Количество повторов informv2количество повторных отправок сообщений, если не пришло подтверждение о доставке.
Таймаут повтора informv2интвервал времени между повторными отправками.
Системный OID, с которого отправляется трапинформационное поле.
Системный OID, означающий тип нотификацииинформационное поле.
Включить транслитерациюконвертация русскоязычных символов в сообщении в лаитиницу.
SNMP trap communityимя сообщества.
Список приоритетов отправляемых событийможет принимать значения DEBUG, INFO, WARN, SEVERE, ERROR, FATAL.



Отправка аварийных сообщений на почту

Отправка сообщений об авариях на почту по протоколу SMTP.

Название параметраОписание
Включить сервисстатус сервиса вкл/выкл.
Адрес сервераIP адрес SMTP сервера.
Порт серверапорт, прослушиваемый SMTP сервером.
Логинлогин учетной записи для на SMTP сервере.
Парольпароль от учетной записи на SMTP сервере.
Использование шифрованияНастройка типа шифрования, используемого почтовым сервером (без шифрования, STARTLS, SSL TLS)
Имя серверадоменное имя SMTP сервера.
Первая строка содержимого письмаинформационное поле, содержит пример сообщения в письме.
От кого (адрес отправителя)email пользователя. от имени которого отправляется сообщение.
EMail адрес службы поддержкиадрес техподдержки, который будет указан в конце письма для обратной связи.


tftpserver

Название параметраОписание
IP адрес для станционных устройствобщий адрес, который используется для работы со станционными устройствами;
Порт (для встроенного TFTP)порт локального (встроенного в  EMS) TFTP сервера, возможные значения  1..65535 (по умолчанию 69);
Каталог корневой службыкаталог корневого сервиса tftpd;
Подкаталог станционного ПОимя подкаталога для файлов станционного ПО, поле не редактируется;
Подкаталог файлов конфигурацииимя подкаталога для файлов конфигурации, поле не редактируется;
Трассировка взаимодействиявывод отладочных сообщений в лог;



wirelessCommon


Название параметраОписание
Максимальное время хранения информации о ТДвремя хранения информации. полученной при открытии вкладок конфигурации точки доступа.
Путь к файлам статических IP адресов DHCP серверов(функционал не используется).
Автоматическая инициализацияавтоматическая инициализация точек доступа от которых были получены трапы присутствия. Функция должна быть активна для автоматической обработке смены IP адресов точками доступа.
Разрешить установку SSID на WDS радиоканалыпо умолчанию функция выключена, т.к. настройка дополнительных SSID вместе с WDS снижает общую скорость передачи данных.
Выключать SSID не имеющие привязкипри работе монитора проверки SSID на точках доступа будут выключаться все SSID, для которых не создана привязка к этой точке доступа в менеджере SSID.
Собирать статистику по количеству пользователейАктивация функции сохранения данных о количестве активных пользователей на точках доступа при отрабатывании монитора синхронизации устройств.
Собирать статистику загрузки uplinkАктивация функции сохранения данных о максимальном к-ве трафика, прошедщего через сетевой интерфейс eth0 на точках доступа. Расчитывается среднее к-во трафика в единицу времени за последний интервал между двумя последними срабатываниями монитора 'Синхронизация устройств' - если расчитанное за интервал значение больше текущего макс. значения, то макс. значение будет обновлено.
Шаг отправки алерта AssociateClients, в сек.Период отправки сообщений об ассоциации клиента
URL Личного КабинетаURL для перехода на сервис Личного Кабинета
Secret для POST запросов к Личному КабинетуСекретный ключ для отправки запросов в Личный Кабинет
Выключить проверку сертификатовВыключает проверку сертификата при настройке подключения через HTTPS к Личному Кабинету






АРМ администратора

Меню отображает информацию об активных пользователях системы.

Список текущих активных пользователей приведен в поле «Активные пользователи», для его обновления необходимо нажать кнопку «Обновить список».


Перезапуск системы EMS

В данном меню осуществляется принудительный перезапуск системы EMS. Для подтверждения необходимо указать пароль для вашей учетной записи в системе.



Поведение графического интерфейса

Настройка цветовой схемы

Настройка осуществляется из меню «Администрирование/Поведение графического интерфейса/Настройка цветовой схемы».

На рисунке приведены цвета для каждого типа аварии, установленные по умолчанию.
Для смены цветового маркера аварии необходимо щелкнуть кнопкой мыши на прямоугольнике требуемого уровня сообщения, откроется меню редактирования для данного типа аварии.

В нижней части каждой вкладки расположена область просмотра (Preview) – для визуальной оценки выбранного цветового решения.
Вкладка Swatches
Swatches – палитра образцов. Здесь возможно выбрать один из готовых цветов, представленных в палитре.
Вкладки HSV и HSL
Цветовая модель HSV(HSB) и HSL- оттенок (тон), насыщенность, яркость (для HSL – уровень света).
Типы палитр:

  • Hue — цветовой тон. Варьируется в пределах 0—360.
  • Saturation — насыщенность. Варьируется в пределах 0—100. Чем больше этот параметр, тем «чище» цвет, чем ближе к нулю, тем ближе цвет к нейтральному серому.
  • Lightness— яркость (уровень света). Варьируется в пределах 0—100.
  • Value – значение цвета. Варьируется в пределах 0—100.
  • Transparency — прозрачность. Варьируется в пределах 0—100.

Желаемый цвет можно получить, передвигая ползунки, выставляя определенные значения в полях или установив курсор в заданную область цветового поля.

Вкладка RGB
Цветовая модель RGB – аддитивная цветовая модель, описывающая способ синтеза цвета для цветовоспроизведения. Каналы – красный, зеленый, синий.
Желаемый цвет можно получить, передвигая ползунки или выставляя определенные значения в полях справа от каждой шкалы.

Вкладка CMYK
Цветовая модель CMYK – субтрактивная схема формирования цвета, используемая прежде всего в полиграфии для стандартной триадной печати. Схема CMYK обладает сравнительно с RGB меньшим цветовым охватом.
Желаемый цвет можно получить, передвигая ползунки или выставляя определенные значения в полях справа от каждой шкалы.

Для сохранения изменений необходимо нажать кнопку «ОК», для выхода из меню редактирования без сохранения изменений – «Cancel». Кнопка «Reset» позволяет отменить текущие изменения без выхода из меню редактирования.
По окончанию настройки цветовой гаммы аварий для вступления изменений в силу необходимо нажать кнопку «Принять», для выхода без сохранения изменений – кнопку «Отменить». По нажатию на кнопку «Default» выводятся цвета, установленные по умолчанию.

Настройка звуковой схемы апплетов

Настройка осуществляется из меню «Администрирование/Поведение графического интерфейса/Настройка звуковой схемы апплетов».

Выбор сопровождающего звукового сигнала при поступлении каждого типа сообщения осуществляется в выпадающем меню.
Для воспроизведения доступны следующие звуки:

  • none – звук отключен;
  • beep – системный сигнал-гудок;
  • sound – системный сигнал-мелодия.

По окончанию настройки звуковой схемы аварий для вступления изменений в силу необходимо нажать кнопку «Принять», для выхода без сохранения изменений – кнопку «Отменить». По нажатию на кнопку «Default» выводятся значения, установленные по умолчанию.
Проверить звучание сопровождающих сигналов можно с помощью кнопки .

ПО устройств

Станционное ПО

Список файлов ПО


Меню содержит таблицу регистрации файлов прошивок в системе EMS для возможности обновления ПО в любом из устройств.
Флаг «Актуальный» позволяет отметить указанный файл ПО как файл для обновления по умолчанию.

Файл ПО возможно использовать для обновления только после его регистрации.

Журнал опроса

Меню содержит таблицу, в которой отображается опрос устройств (запрос текущих версий). Опрос версий выполняется монитором "Прошивки FW", который, согласно собственных настроек, периодически опрашивает все устройства сети и сохраняет в БД. Это позволяет контролировать все версии FW всех устройств сети. Идентифицируется "Тип информации"=READ.
 
События в журнале возможно отфильтровать по одному или нескольким параметрам.
Список фильтров записей журнала:

  • Тип устройства – выбор осуществляется из выпадающего списка;
  • Полный тип устройства – тип устройства, выбор осуществляется из выпадающего списка;
  • IP – IP-адрес источника сообщения;
  • Тип информации – все/UNKNOWN/UPLOAD/READ;
  • Инициатор – инициатор процесса;
  • Дата: от/до– временные рамки создания записи в формате ДД.ММ.ГГГГ либо ДД.ММ.ГГГГ ЧЧ.ММ;
  • Версия ПО.

В поле «Количество записей» производится настройка объема сообщений, выводимых на страницу. Для навигации по страницам используется панель закладок в нижней части окна.
Для перевода значений всех фильтров в исходное состояние необходимо воспользоваться кнопкой «Очистить фильтры».


Получение логов работы сервера EMS

В данном меню осуществляется выгрузка файлов логов работы сервера EMS, captive portal:

  • /var/log/eltex-portal/debug_ep.txt
  • /var/log/eltex-portal/error_ep.txt
  • /var/log/eltex-portal/sms_ep.txt
  • /var/log/eltex-ems/black_box.txt
  • /var/log/eltex-ems/ems_error.txt


Файлы доступны по ссылке для скачивания архива в задаче.

Ниже приведено содержание архива.


Работа с авариями

Общие принципы получения, хранения, отображения, автоочистки

Событиями в системе управления EMS являются:

  • SNMP trap, принятые от устройств работающих в сети;
  • SNMP trap от внутренних компонентов окружения системы EMS (например, от Keepalived);
  • системные сообщения, полученные на основе данных, получаемых системой EMS (например, контроль доступа – ping, контроль температуры устройств) при выходе контролируемых величин из допустимого диапазона;
  • ошибки работы внутренних процессов системы EMS (мониторов, асинхронных задач), выведенные в виде аварий для отображения в меню «Активные аварии» и привлечения внимания оператора.

События могут служить для следующих целей:

  • информирование пользователя о внештатных ситуация (авариях);
  • сбор и отображение оперативной информации о работе элементов сети (смена состояний ONT, подключение клиентов Wi-Fi).

Все принятые события могут сохраняются в базу данных MySQL.
Исключения (т.е. указание не сохранять сообщения в БД) могут быть настроены через GUI (см. ниже).
Записи из БД отображаются на вкладках «Мониторинг/Журнал событий» индивидуально для каждого устройства.
Также в системе EMS доступно меню «События/Журнал событий», где можно просмотреть события для всех устройств и самого сервера EMS.

Настройка приёма сообщений (трапов). Принципы фильтрации


Все правила обработки сообщений изначально заданы разработчиками системы SoftWLC в конфигурационном файле TrapRules.xml и не предполагают вмешательства со стороны пользователя системы.

Настройки, доступные для пользователя, выведены в GUI интерфейс (меню «Администрирование/Настройка сервера/Прием и обработка SNMP трапов») и хранятся в БД. Их значения переопределяют исходные значения, указанные в TrapRules.xml.

Фильтр «OID» используется для поиска нужного события в списке.
Фильтр «Устройство» используется для выделения из списка группы аварий, характерных для того или иного устройства.
Группа «ALL» объединяет события, которые высылаются в одинаковом формате для всех типов устройств.
Группа «KEEPALIVED» объединяет сообщения о смене состояний компонентов системы при резервировании.
Группа «EMS_SERVER» объединяет сообщения генерируемые самой системой EMS.
Для изменения (кнопка «Редактировать») оператору доступны следующие параметры:

    • Disabled – в значении «true» - полностью выключить обработку трапа (не сохранять в БД, не выполнять обработку события);
    • Priority – приоритет события; задает степень важности события для системы EMS;
    • Always closed – «всегда закрыт» - при указании значения «true» сообщение сохраняется в БД, но не отображается на вкладке «Активные аварии».
    • Не хранить в БД – значение «true» отключает сохранение записи события в БД, но не блокирует работу системных обработчиков события в системе EMS.

Для системных сообщений управление некоторыми параметрами может быть ограничено разработчиками, так как подобные изменения могут нарушить работоспособность системы.
Кнопка «Сброс» служит для очистки параметров приема трапа из БД и приводит к возврату к значениям, указанным в TrapRules.xml.
Кнопка «Черный список» позволяет ограничить круг устройств, от которых будет приниматься трап. Такое действие может потребоваться для блокировки приема сообщений с устройства, временно выведенного из нормальной работы, чтобы не отвлекать оператора присутствием событий в «Активных событиях» и «Журнале событий». Настраивается индивидуально. Запрещено редактирование Черного списка для системных сообщений.

Настройка автоочистки, выгрузки на внешние носители (мониторы, скрипты, cron)

Автоматическая очистка аварий выполняется монитором «Экспорт журнала сообщений (alerts_archiving)».
Удаление событий выполняется по партициям (разбивка БД по дням).
Если в настройках монитора указана опция «enable_export», то перед удалением записи сохраняются в csv файл.

Принцип отображения в GUI: таблица сигнализации (включая настройку цвета, звука)

Администратору SoftWLC доступны следующие настройки отображения аварий в меню «Администрирование/Поведение графического интерфейса»:

    • Настройка цветовой схемы – служит для ассоциации приоритета событий (и syslog сообщений) с определенным цветом на усмотрение оператора (подробнее в разделе 13.1);
    • Настройка звуковой схемы аварий – служит для ассоциации приоритета событий со звуковой сигнализацией (подробнее в разделе 13.2).

В настройке звуковой схемы отображаются только те приоритеты, которые отображаются в «Активных событиях». По принятой договоренности события INFO и CLEAR в «Активных событиях» не отображаются, так как не могут быть удалены оттуда.
При настройке звука доступны следующие опции:

    • выключено говорит о том, что событие указанного приоритета не приводит к включению звуковой сигнализации;
    • системный beep – сигнализирует через установленный на материнской плате бипер;
    • звук динамиков включает полноценную звуковую сигнализацию, для работы которой требуются подключенный динамики и корректная настройка звука в операционной системе оператора.

Все звуки могут быть прослушаны в диалоге настройки с помощью кнопки с изображением динамика.
Звуки приоритетов назначены разработчиками системы, загрузка своих мелодий, индивидуальная настройка звуков для отдельных аварий системой не предусмотрена.

Принцип автоочистки аварий (OID, значащие параметры)

Все события, приоритет которых выше чем INFO, попадают в «Активные аварии».
Активные аварии – это динамический список событий, который существует только в оперативной памяти системы. С базой данных он никак не связан.
При получении аварии (например, OID1, Критическая нагрузка на канал №3), в «Активные аварии» попадает авария уровня MAJOR. В случае повторного получения аварийного события система обновит дату приема сообщения, чтобы событие переместилось вверх в таблице при постоянной сортировке по времени. Дату получения первого аварийного сообщения можно будет установить по параметру «Время возникновения». Ключом к установлению уникального события является комбинация ID устройства в дереве, OID сообщения и значимых параметров. Значимым параметром в указанном примере является номер канала. Конфигурация TrapRules.xml позволяет назначить связь между OK-событием и аварией. Это значит, что в правило обработки OID2 (нагрузка на канал в норме) включен параметр NormalizesOID. По комбинации ID устройства, NormalizesOID и значимых параметров система EMS находит активную аварию OID1 и удаляет ее из списка «Активных событий». Этот процесс в системе EMS называется нормализацией. В БД («Журнал событий») в этом случае попадает запись уровня CLEAR, где сообщается, что критической нагрузки на канал №3 больше нет. Записи, полученные при приеме аварийных сообщений, в БД никак не модифицируются (иначе это была бы бессмысленная нагрузка на БД). Время возникновения и устранения аварии устанавливается по времени записи аварийного и активного события в БД.

Отличия между журналом событий (log) и активными авариями

«Журнал событий» это непрерывная лента событий в системе EMS, куда последовательно записываются все события для устройств сети и самой системы. «Активные аварии» - виртуальный список событий, количество записей в котором при нормальной работе сети должно стремиться к нулю.
Вкладка «Активные аварии» обновляется автоматически на основе данных, постоянно присылаемых сервером в GUI пользователя.
Отключить автообновление можно, сняв флаг «Автообновление» на вкладке.
Фильтр на вкладке «Активные аварии» позволяет отобразить часть записей по определенному условию: присутствие всех перечисленных слов (разделенных пробелом) в строке таблицы (вне зависимости от колонки), присутствие хотя бы одного из перечисленных слов в строке таблицы (если стоит галочка ИЛИ).
Также «Активные аварии» отвечают за включение Сигнализации. Каждый раз при обновлении списка «Активных с аварий» GUI проверяет обновленный список на предмет наличия в нем аварии, на приоритете которой включена звуковая сигнализация. Если такая авария присутствует, включается звуковое оповещение. Сигнализацию можно остановить (когда оператор занялся проблемой) с помощью кнопки «Выключить» на вкладке «Активные аварии». Однако при следующем получении аварийного сообщения от устройства сигнализация будет включена повторно.
Для информирования пользователя об активной сигнализации в меню «События» (верхний правый угол конфигуратора) текст подсвечивается красным, и при наведении указателя мыши в подсказке можно увидеть источник и текст аварии, которая стала причиной включения сигнализации в этот раз.
Для «Активных аварий» доступно редактирование статуса.
При переводе события в состояние «В обработке» в БД для данного события отмечается дата обработки и пользователь-обработчик.
При переводе в состояние «Закрыто» в БД для данного события отмечается дата закрытия и пользователь, закрывший аварию. При переводе в состояние «Закрыто» авария пропадает из списка «Активных аварий».
Также доступно массовое удаление записей из «Активных аварий». Для этого существует меню правой кнопки мыши «Удалить все активные события для устройства или узла». В открывшемся диалоге пользователю нужно выбрать: очистить ли все аварии для устройства, на котором возникла выделенная авария, или очистить все аварии для всех устройств узла, где находится устройство.

Вывод статистики активных аварий

Статистика «Активных аварий» отображается в верхнем правом углу и показывается число аварий на устройстве, на котором работает пользователь, или на узле, если оператор работает с вкладками узла.
В меню «События/Статистика активных аварий» можно увидеть данных о числе аварий по приоритетам по всем устройствам сети.

Ручной экспорт аварий: текущие (с экрана) или по фильтру (с сервера)

Записи вкладки «Журнал событий» можно сохранить в файл.
Для этого существуют две кнопки:

  • Экспорт – служит для сохранения выделенных в GUI записей. Пользователю нужно выделить нужные строки и выбрать путь для нового файла. Файл формируется в формате csv. В дальнейшем может быть импортирован в любой текстовый редактор для работы с таблицами (MS Office Excel, OpenOffice Calc).
  • Сохранить – служит для вывода содержимого таблицы БД в файл в формате csv. В этом случае содержимое файла определяется по фильтрам на вкладке. Все записи БД, удовлетворяющие этим фильтрам, будут сохранены в файл. Сохранение в файлы выполняется средствами MySQL на сервере. Прогресс выполнения и результат отображается на вкладке «Задачи» (нижняя часть апплета, по умолчанию свернута). В случае успеха пользователю будет предоставлена возможность скачать файл по ссылке. Полный текст задачи открывается по двойному щелчку.
Журнал Syslog

Журнал «Syslog» служит для сбора syslog-сообщений с устройств сети.
Для этого на хосте системы работает rsyslog, модуль которого, rsyslog-mysql, позволяет сохранять все полученные по сети сообщения в базу данных для последующей обработки.
Для записей таблицы Syslog доступны операции экспорта и сохранения, работа которых полностью аналогична их работе с авариями.

Подсистема опроса доступа устройств. Принцип генерации аварии недоступного устройства

Важным компонентом системы EMS является «Опрос доступности устройств».
Включается в настройках модулей системы (меню «Администрирование/Настройка сервера/Системные модули») в модуле system «Опрос доступности (ICMP, SNMP ping)».
Опрос доступности выполняется по протоколу ICMP и SNMP и позволяется оперативно информировать пользователя о нарушении связи с устройством в целом или о наличии проблем в работе SNMP-протокола.
Для опроса доступности по SNMP выполняется GET запрос на OID 1.3.6.1.2.1.1.3.0 (SNMPv2-MIB::sysUpTime.0).
Статистика по времени получения ответа может быть получена на вкладке «Мониторинг/Статистика ICMP», «Статистика SNMP» для каждого устройства индивидуально в виде графика.
Также подсистема опроса доступности отвечает за генерацию системной аварий «Потеря связи» и ОК-события «Восстановление связи».
К восстановлению связи может быть привязана синхронизация устройства (реализовано для LTP, MA4000, WEP, WOP). Функция увеличивает нагрузку на SNMP на устройстве и потому включается при необходимости в настройках модулей системы в модуле system «Синхронизировать устройство после восстановления связи по SNMP».



Контроль и управление резервированием

Просмотр и управление режимом резервирования в GUI осуществляется через диалог пункта меню «Информация/Состояние системы резервирования» главного меню апплета.
Контроль состояния системы резервирования Keepalived в GUI осуществляется в меню «Информация/ Состояние системы резервирования».

В диалоге по нажатию на кнопку «Общие» отображается:

  • текущая версия ПО Keepalived;
  • Router ID – идентификатор реального сервера, на котором в данный момент активен виртуальный IP-адрес (то же значение указано в колонке RouterID в основной таблице). Router ID задается к конфигурации keepalived.conf, для наглядности рекомендуется включать в него часть IP-адреса;
  • настройки оповещения по e-mail
  • статус оповещения SNMP-trap;
  • текущий тип работы с интерфейсами.


В диалоге по нажатию на кнопку «Статистика» отображается текущая конфигурация и состояние выбранного виртуального или реального сервера.
В основной таблице отображаются:

  • VirtualServerIndex – индекс виртуального сервера;
  • Type – тип входящих в него серверов (одного виртуального и N реальных);
  • Address – IP-адрес виртуального/реального сервера;
  • Status – текущий статус виртуального/реального сервера (возможны значения alive и dead);
  • Weight В данной версии не используется – вес может использоваться для балансировки нагрузки;
  • Router ID – идентификатор реального сервера, на котором в данный момент активен виртуальный IP-адрес (отображается только для виртуального сервера);
  • Action – в случае недоступности сервера и при наличии в БД записи по намеренному выключению сервера из работы отображается время выключения сервера.

Кнопки «Включить»/«Выключить» позволяют управлять состоянием сервиса eltex-ems на реальных серверах.
Управление осуществляется через сценарий /usr/lib/eltex-ems/scripts/switch-remote-ems.sh.
В switch-remote-ems.sh должны быть указаны работоспособные параметры доступа по протоколу SSH к удаленному серверу (login, password).
Эти параметры должны быть одинаковы на всех машинах; назначение персональных параметров доступа к каждому из серверов системой не предусмотрено.
В случае ошибки выполнения скрипта (например, из-за некорректных настроек параметров доступа) в GUI отобразится ошибка.

На выполнение задачи включения-выключения сервиса требуется некоторое время, сразу после успешного выполнения скрипта сервер не перейдет в новое состояние мгновенно. После получения SNMP-сообщения о смене состояния сервера таблица обновится автоматически.

На вкладке «Активные аварии» и в системном журнале событий доступны последние сообщения:

  • смена состава реальных серверов;
  • переход реального сервера в состояние master (ведущий).
Методика проверки

Проверка системы резервирования осуществляется после настройки всех вышеперечисленных служб: mysql, rsync, keepalived и заполнения конфигурационных файлов всех сопутствующих скриптов.
Требуется проверить корректность обработки следующих ситуаций:

  • внезапное выключение одного из серверов по питанию;
  • остановка службы eltex-ems;
  • остановка службы tomcat6;
  • пропадание связи с одним из серверов;
  • ручное переключение мастерства из EMS GUI.

Необходимо проверить поведение системы как при аварийной ситуации, так и при восстановлении (связи, питания, служб и т. д.).
Необходимо убедиться в следующем:

  • при нарушении работы Master-сервера виртуальный адрес передаётся резервному;
  • передача ведущей роли сопровождается сообщением в СУ (активные аварии, журнал событий);
  • передача ведущей роли сопровождается назначением виртуального IP-адреса.
  • восстановление работоспособности бывшего Master-хоста не приводит к возврату статуса Master на хост;
  • все изменения в записях БД, связанные с оперативной работой сервиса eltex-ems (объекты, роли, пользователи, настройки), реплицируются на оба сервера (БД) и доступны и актуальны сразу после потери связи;
  • файлы конфигураций и образов ПО синхронны на обоих серверах.

Для контроля используются:

  • консольная утилита ifconfig для контроля адреса vip;
  • консольный клиентMySQL для контроля содержимого БД;
  • SoftWLC GUI для контроля генерации аварийных сообщений, контроля корректности подключения к vip, контроля статуса серверов;
  • консольный файловый менеджер mc для контроля синхронности файлов ПО, конфигураций на обоих серверах.


Самоконтроль работы системы (сторожевой таймер (watchdog))

Программный комплекс SoftWLC состоит из серверной и клиентской части. Клиентская часть (GUI) выполняется на ПК пользователя в браузере. Серверная часть (Server) функционирует на отдельном сервере (или паре серверов в варианте с резервированием). Для обеспечения непрерывной работы на сервере используется механизм самоконтроля, сторожевой таймер (контрольный таймер, англ. Watchdog). Задачей данного механизма является периодический опрос сервера с целью определения работоспособного состояния. В случае, когда сторожевой таймер определяет, что сервер недоступен, выполняется попытка принудительного перезапуска основной службы eltex-ems, и в случае необходимости – вспомогательного WEB-сервера tomcat6.
Механизм контроля основан на опросе одного из интерфейсов сервера, предназначенного для межмашинного взаимодействия: http web service. Данный интерфейс предназначен для общения между службами eltex-ems в варианте с резервированием серверов, а также может использоваться для самодиагностики, для фиксации выдачи DHCP-адресов (в варианте с модифицированным сервером dhcpd-eltex), для получения списка OLT, получения версии сервера в консольном режиме и прочего служебного обмена.
Технологически самоконтроль реализован в виде скрипта, который периодически запускает операционная система Linux в рамках собственной службы cron. Скрипт находится в файле:

/usr/lib/eltex-ems/scripts/check_ems_srv.sh


В службе cron поведение регулируется файлом:

/etc/cron.d/ems-backup

Запись в файле:

*/5 * * * * root /usr/lib/eltex-ems/scripts/check_ems_srv.sh

Алгоритмконтроля:

  • служба cron выполняет контрольный опрос сервера с периодом в 5 минут;
  • при недоступности сервера производится серия дополнительных запросов внутри скрипта. Всего производится три запроса с интервалом в 10 секунд;
  • в случае недоступности запросов всей серии скрипт анализирует код ошибки. В зависимости от кода ошибки выполняется перезапуск службы tomcat6 или служб eltex-ems и tomcat6.
Механизм самоконтроля системы намеренно реализован таким образом, чтобы было задействовано как ядро системы eltex-ems (сервер обмена с устройствами), так и WEB-сервер tomcat6, который реализует три функции:
  1. Выдача GUI-апплета пользователю СУ;
  2. Обеспечение функционирования служебного интерфейса (http web service);
  3. Обеспечение работы Northbound по протоколу SOAP/XML.|
    Во время работы скрипт сторожевого таймера журналирует состояние системы и статус ответов сервера в файл:
    /var/log/eltex-ems/check/ems-check.<current-date>.txt
    В файле содержатся записи следующего вида:

----------------------------- (START) ------------------------------
14-06-2017 	15:45:01: System information:
14-06-2017 	15:45:01: Linux ubuntu 4.4.0-78-generic #99~14.04.2-Ubuntu SMP Thu Apr 27 18:49:46 UTC 2017 x86_64 x86_64 x86_64 GNU/Linux
14-06-2017 	15:45:01: java version "1.8.0_131"
Java(TM) SE Runtime Environment (build 1.8.0_131-b11)
Java HotSpot(TM) 64-Bit Server VM (build 25.131-b11, mixed mode)
14-06-2017 	15:45:01: LoadAverage info
14-06-2017 	15:45:01: 1min 5min 15min
14-06-2017 	15:45:01: 0.01 0.04 0.03 1/571 4244
14-06-2017 	15:45:01: RAM MemFree: 91596 kB
Disk info
Disk 			Size 	Used	Available 	Used % 	Mount
/dev/sda1 		15G 	11G 	3,1G 		79% 	/
14-06-2017 	15:45:01: EMS status: Eltex.EMS Server is running with pid 30258
14-06-2017 	15:45:01: Tomcat status: * Tomcat servlet engine is running with pid 30891
14-06-2017 	15:45:01: ports (9310, 9340, 8080) status:
tcp6 		0 0 :::9310 :::* LISTEN 30260/java
tcp 		0 1 192.168.15.106:33608 192.168.26.201:8080 SYN_SENT 4216/curl 
tcp6 		0 0 :::8080 :::* LISTEN 30891/java
14-06-2017: Northbound is working
14-06-2017: EMS and Northbound are working


Журналирование для каждой даты ведётся в отдельных файлах, ротация производится согласно общим настройкам SoftWLC (настройки монитора архивирования и очистки журналов).
По записям возможно восстановить дату и время принудительного перезапуска служб, а также состояние системы во время контроля: загрузка процессора, использование памяти, количество свободного места на жёстких дисках. Если сервер недоступен, в журнал будет выведена трассировка ошибки, указывающая на источник проблемы.
В случае если служба eltex-ems намеренно остановлена командой:

sudo service eltex-ems stop

скрипт самодиагностики не производит принудительный запуск службы.
В случае запуска скрипта в консоли пользователь увидит запись:

EMS service disabled. No checks will be performed.

Ручной запуск скрипта можно выполнить с правами суперпользователя:

sudo /usr/lib/eltex-ems/scripts/check_ems_srv.sh

Контроль доступности сервера SoftWLC из консоли без использования скрипта можно выполнить командой:

curl -shttp://localhost:8080/northbound/getVersion

В ответ работоспособный сервер вернёт xml-сообщение с версией ПО.
$ curl -s http://localhost:8080/northbound/getVersion

 
В инсталляциях с резервированием серверов данный механизм используется и для определения доступности сервера при распределении ролей Master и Backup между двумя и более физическими хостами.




Мониторинг параметров сервер через SNMP

OID

Тип

Описание

1.3.6.1.4.1.2021.10.1.3.1

OctetString

Load average 1 минута

1.3.6.1.4.1.2021.10.1.3.2

OctetString

Load average 5 минут

1.3.6.1.4.1.2021.10.1.3.3

OctetString

Load average 15 минут

1.3.6.1.4.1.2021.4.6.0

Integer

ОЗУ, свободно, в Кбайт

1.3.6.1.4.1.2021.4.5.0

Integer

ОЗУ, всего, в Кбайт

1.3.6.1.4.1.2021.4.4.

Integer

Swap свободно, в Кбайт

1.3.6.1.4.1.2021.4.3.0

Integer

Swap всего, в Кбайт

1.3.6.1.2.1.25.2.3.1.5.31

Integer

Полный размер корневой файловой системы сервера, в блоках (см. ниже)

1.3.6.1.2.1.25.2.3.1.6.31

Integer

Объём занятого дискового пространства корневой файловой системы сервера, в блоках (см. ниже)

1.3.6.1.2.1.25.2.3.1.4.31

Integer

Размер блоков, в которых измеряется объём дисков сервера

1.3.6.1.4.1.9586.100.5.2.3.1.4.1

Integer

Роль сервера в системе резервирования. Возможные значения:
1 — backup
2 — master

Мониторинг дисковой подсистемы выполняется с помощью таблицы hrStorageTable (1.3.6.1.2.1.25.2.3) из MIB Host Resources (RFC1514).
Таблица имеет следующую структуру:

HrStorageEntry ::= SEQUENCE {
	hrStorageIndex INTEGER,
	hrStorageType OBJECT IDENTIFIER,
	hrStorageDescr DisplayString,
	hrStorageAllocationUnits INTEGER,
	hrStorageSize INTEGER,
	hrStorageUsed INTEGER,
	hrStorageAllocationFailures Counter
}

Каждая запись в таблице описывает один ресурс сервера. Это может быть, например, ОЗУ или дисковый накопитель.
Для каждой записи указывается:

  • hrStorageDescr — название ресурса, например «Swap space» или «/» - корневая файловая система;
  • hrStorageAllocationUnits — размерность единиц измерения, в которых указываются размеры дисков и количество занятого пространства. Иными словами — количество байтов в блоке;
  • hrStorageSize — полный размер ресурса (в блоках);
  • hrStorageUsed объём занятого пространства ресурса (в блоках).

При работе в условиях системы резервирования мониторинг параметров серверов необходимо выполнять по реальным IP-адресам.


  • No labels