Сервер — сложное техническое устройство, в котором могут возникать неполадки не только на физическом уровне, но и на уровне операционной системы, программного обеспечения или веб-сервера. Это приводит к широкому спектру проблемных сценариев.
Для обнаружения и предотвращения сбоев важно иметь надежную систему мониторинга, которая будет анализировать аппаратное обеспечение, сети и коммуникации, работу операционной системы и приложений.
С 2016 года мы успешно занимаемся внедрением Битрикс24 и оказываем услуги технической поддержки. В связи с большим пулом администрируемых компанией ПУСК порталов, серверов и сайтов, требовался инструмент мониторинга. Наши специалисты сравнили различные штатные средства отслеживания и контроля, в том числе:
- Munin
- Monit
- Nagios
Проанализировав функциональные возможности каждой системы, мы поняли, что данных инструментов недостаточно. Нужны более гибкие настройки для отслеживания:
- Свободного места на серверах клиентов
- Срока SSL-сертификатов на сайтах и порталах клиента
- Срока действия доменов как клиентских, так и своих
- Поломок базы MySQL
- Доступности сайта или портала клиента
- Доступности сервера клиента
Для решения вышеперечисленных задач было решено остановить выбор на системе Zabbix. Это – профессиональная система мониторинга с богатыми средствами визуализации, отслеживания статусов и возможностью хранить историю.
На установку, настройку и внедрение системы ушло два месяца. В ходе настройки нашим специалистом были решены следующие задачи:
- написание порядка 250 рукописных триггеров, для отслеживания различных показателей систем
- создание бота для удобства коммуникаций
- разработка 10 скриптов для автоматизации процессов мониторинга и отправки уведомлений через вебхук
На данный момент всё работает в штатном режиме. При срабатывании триггера об ошибках на сервере или поломках в базе данных, отправляется почтовое уведомление всем сотрудникам технического отдела. Для более оперативного реагирования дополнительно отправляется сообщение об ошибке в чат – при помощи настроенного бота.
1. Пример отслеживания свободного места на жестких дисках клиентов:
В таблице выводится свободное дисковое пространство. Этот параметр важно отслеживать при регулярном копировании – создании бекапа, и работа портала напрямую зависит от количества места на жестком диске.
Помимо этого, загруженный на 99% портал будет работать медленнее, что влияет на продуктивность пользователей.
2. Пример отслеживания потребления ОЗУ на серверах клиентов:
Объем оперативной памяти связан со скоростью работы портала. Для комфортной работы мы рекомендуем минимум 1Гб ОЗУ. Если используется Push&Pull сервер – то 2Гб и выше.
3. Пример мониторинга срока SSL-сертификата на порталах клиентов:
SSL-сертификат – это уникальная цифровая подпись, необходимая для безопасной работы в сети.
Технически, коробочная версия Битрикс может функционировать и без SSL-сертификата к домену портала. Но такие модули как телефония, открытые линии, аудио- и видеозвонки через десктоп-приложение требуют наличия активного цифрового сертификата.
4. Пример отслеживания всех серверов клиента в реальном времени (для предотвращения поломок портала):
Мониторинг гарантирует клиентам ПУСК надежную отказоустойчивую систему. На порталах наших заказчиков критичных или фатальных ошибок не происходит, поскольку 90% поломок предотвращаются до их появления. Благодаря системе оповещения наши специалисты узнают о поломке сразу после её появления:
При этом сами данные, хранящиеся на сервере, недоступны извне и по-прежнему защищены от несанкционированного доступа.
Zabbix – удобный инструмент мониторинга, который в умелых руках превращается в самое грозное оружие по предотвращению поломок!
Если у вас остались вопросы по мониторингу системы Битрикс24 специалистами ПУСК, свяжитесь с нами любым удобным способом. Для заказа технической поддержки и сопровождения портала оставьте заявку менеджеру по телефону +7 (495) 118-39-18.