Отслеживаем работу InvariMatch на серверах

Как только мы стали поставлять нашу систему распознавания и поиска видео клиентам, возникла необходимость отслеживать стабильность ее работы. Не видя параметров системы, сложно понять, что с ней происходит, а о характере неисправностей приходится догадываться только по внешним признакам. Это неудобно и не позволяет быстро понять причину и устранить проблему. Поэтому мы почти сразу решили поставить систему мониторинга.

У одного из наших первых клиентов уже был подключен Zabbix, поэтому мы остановились именно на нем. 6 октября 2017 года мы перенесли все технические параметры InvariMatch туда, чтобы системный администратор мог следить за ними в режиме реального времени и оперативно получать данные о сбоях.

Zabbix — это готовая система, которая подходит для мониторинга состояния сервисов на множестве компьютеров. Она показывает параметры системы в виде графиков.

Для мониторинга InvariVision мы с самого начала использовали графики — так легче воспринимать данные и анализировать изменения в работе системы. Для хранения данных Zabbix использует MySQL, PostgreSQL, SQLite или Oracle Database и поддерживает несколько видов мониторинга.

Благодаря Zabbix, которая отображает параметры работы системы в виде графиков, мы видим количество роликов, которые были просканированы и добавлены в систему за последний час, сколько совпадений найдено, сколько заявок сейчас обрабатывает система, сколько находится в очереди и другие параметры. Это позволяет нам следить за производительностью InvariMatch, видеть неисправности в ее работе, анализировать полученные данные и на основе этого совершенствовать нашу технологию.

график производительности ядер
входящие запросы
загруженность сети

Через некоторое время после подключения Zabbix, возникла необходимость собирать данные по каждой ошибке в отдельности и следить за их повторяемостью. В феврале 2018 года мы разделили графики ошибок в системе на три части и сделали шаблоны для быстрого добавления параметров на новые сервисы.

Zabbix позволил нам получать полные данные о работе системы на клиентских серверах и компьютерах. Например, если мы видим падение нагрузки в системе, это может означать сбой на стороне клиента или проведение каких-либо наладочных работ. Благодаря этому мы можем оперативно устранять проблемы в работе системы.

Zabbix существует на рынке уже около 20 лет. За это время появилось много аналогов, но необходимости в том, чтобы переходить на другую систему мониторинга пока нет. Zabbix отлично справляется со своими задачами и сильно помогает нам в работе.