Перейти к основному содержимому

Практикум Zabbix — что это и как работает

Инженеру

Практикум, шаг 1 из 6. Дальше — установка.


Зачем Zabbix

Zabbix — система мониторинга с открытым исходным кодом для доступности и производительности ИТ-инфраструктуры: серверы, сетевое оборудование, виртуализация, приложения, веб-сайты. В отличие от связки Prometheus + Grafana, Zabbix даёт единый веб-интерфейс для конфигурации, графиков, карт сети, SLA и оповещений — без отдельного «слоя визуализации».

Суть работы в одной цепочке:

  1. Собрать значения (CPU, место на диске, HTTP-код, SNMP-контр).
  2. Сохранить историю во встроенной БД (PostgreSQL, MySQL и др.).
  3. Оценить правилами (триггеры).
  4. Сообщить людям или ITSM при нарушении порога.

Подробное сравнение с Prometheus и Nagios — в главе про мониторинг.


Возможности

НаправлениеЧто даёт Zabbix
Сбор метрикАгенты на хостах, SNMP, IPMI, JMX, опрос API, разбор лог-файлов, выполнение скриптов на узле
ОповещенияEmail, Telegram, Slack, SMS, интеграция с Jira, ServiceNow и др. через actions
ВизуализацияГрафики, сводные экраны (screens), карты (maps), дашборды
Веб-мониторингСценарии «как пользователь» — время отклика, HTTP-статусы, проверка SSL-сертификатов
АвтообнаружениеСетевое discovery, LLD — новые диски, интерфейсы, контейнеры подхватываются шаблоном

Базовые компоненты

КомпонентНазначение
Zabbix ServerЯдро — расписание опросов, триггеры, actions, запись в БД
Zabbix Agent / Agent 2Локальный сбор на узле (CPU, RAM, диски, сервисы). Agent 2 — современная ветка с плагинами
Web-интерфейсНастройка, просмотр «Monitoring → Latest data», отчёты
Zabbix ProxyПромежуточный узел в удалённом офисе или DMZ — буферизация и снижение нагрузки на центральный сервер

Сервер не заменяет агент там, где нужны глубокие локальные метрики — он координирует опрос и хранит конфигурацию.


Модель данных — четыре опоры

Практикум строится на четырёх сущностях. Их имена в UI совпадают с документацией:

СущностьСмыслПример
Host (узел)Объект мониторинга — сервер, коммутатор, сайтweb-01.prod
Item (элемент данных)Что именно меряем и как частоsystem.cpu.util каждые 60 с
Trigger (триггер)Логическое условие на значенияхCPU > 90 % в течение 5 мин
Template (шаблон)Переиспользуемый набор items, triggers, graphsLinux by Zabbix agent

Дополнительно:

  • Discovery — правила автоматического создания items для новых объектов (диски, сетевые интерфейсы).
  • Action — что делать при срабатывании триггера (письмо, скрипт, тикет).

Пассивные и активные проверки

РежимКто инициируетКогда удобно
ПассивныйСервер подключается к агенту (порт 10050)Лаборатория, DMZ с открытым портом к агенту
АктивныйАгент сам отправляет данные на сервер (10051)Фаерволы, NAT, много узлов за одним исходящим каналом

В корпоративных сетях чаще включают активные проверки — см. шаг 5.


Когда выбирать Zabbix

Zabbix уместен, если нужны:

  • единая консоль для серверов, сети и веб;
  • готовые шаблоны под Linux, Windows, MySQL, VMware;
  • карты и SLA-отчёты для руководства;
  • мониторинг legacy через SNMP и SSH без встраивания экспортёров в каждое приложение.

Для cloud-native микросервисов с PromQL и OpenTelemetry чаще берут Prometheus + Grafana — их роль в 92.md и инструментах мониторинга.


Что дальше

На шаге 2 развернём сервер и агенты по официальному руководству по установке.


См. также

Другие статьи этого же раздела в боковом меню (как на странице "О разделе").