Перейти к основному содержимому

Мониторинг

Мониторинг — процесс сбора, анализа и визуализации метрик и событий в программных и аппаратных компонентах ИТ-инфраструктуры. Цель — обеспечение доступности, производительности и своевременного выявления аномалий. Ниже перечислены инструменты для различных уровней мониторинга: от локальных систем до распределённых сервисов.


1. Системный мониторинг (локальный)

Текущие метрики ресурсов (CPU, RAM, Disk, Network)

  • htop
    Интерактивный монитор процессов с цветовой индикацией.
    Установка:

    sudo apt install htop          # Debian/Ubuntu
    sudo dnf install htop # Fedora
    brew install htop # macOS
  • glances
    Многофункциональный монитор с веб-интерфейсом и API.
    Установка:

    pip3 install glances
    # или
    sudo apt install glances
  • nmon
    Мониторинг ресурсов в реальном времени и экспорт в CSV.
    Установка:

    sudo apt install nmon
  • bpytop/bashtop
    Современные альтернативы htop с расширенной визуализацией.
    Установка bpytop:

    pip3 install bpytop
  • iostat, vmstat, mpstat (из пакета sysstat)
    Статистика по дисковым операциям, памяти, CPU.
    Установка:

    sudo apt install sysstat
  • dstat
    Универсальный замер ресурсов с поддержкой плагинов.
    Установка:

    sudo apt install dstat

2. Сетевой мониторинг

  • iftop
    Отображение трафика в реальном времени по сетевым соединениям.
    Установка:

    sudo apt install iftop
  • nethogs
    Группировка трафика по процессам.
    Установка:

    sudo apt install nethogs
  • ss, netstat, ip
    Встроенные утилиты для анализа сетевых сокетов и интерфейсов.

  • tcpdump
    Захват сетевых пакетов.
    Установка:

    sudo apt install tcpdump
  • Wireshark
    Графический анализатор сетевого трафика.
    Установка:

    sudo apt install wireshark
    # macOS: brew install --cask wireshark

    Сайт: wireshark.org

  • nmap
    Сканирование портов и обнаружение хостов.
    Установка:

    sudo apt install nmap
    brew install nmap

3. Мониторинг приложений и служб

  • Prometheus
    Система сбора временных рядов с мощной моделью запросов (PromQL).
    Установка:

    wget https://github.com/prometheus/prometheus/releases/latest/download/prometheus-*.linux-amd64.tar.gz
    tar xvfz prometheus-*.linux-amd64.tar.gz

    Сайт: prometheus.io

  • Node Exporter
    Экспортер системных метрик для Prometheus.
    Установка:

    wget https://github.com/prometheus/node_exporter/releases/latest/download/node_exporter-*.linux-amd64.tar.gz
  • cAdvisor
    Мониторинг контейнеров (CPU, память, сеть, диски).
    Запуск через Docker:

    docker run -d --name=cadvisor -p 8080:8080 --volume=/:/rootfs:ro --volume=/var/run:/var/run:ro --volume=/sys:/sys:ro --volume=/var/lib/docker/:/var/lib/docker:ro google/cadvisor:latest
  • Blackbox Exporter
    Мониторинг доступности HTTP, DNS, TCP и других служб извне.
    Установка — через релизы на GitHub: github.com/prometheus/blackbox_exporter


4. Визуализация и дашборды

  • Grafana
    Платформа для построения дашбордов на основе данных из Prometheus, InfluxDB, Graphite и др.
    Установка (Debian/Ubuntu):

    sudo apt install -y software-properties-common
    wget -q -O - https://packages.grafana.com/gpg.key | sudo apt-key add -
    echo "deb https://packages.grafana.com/oss/deb stable main" | sudo tee -a /etc/apt/sources.list.d/grafana.list
    sudo apt update && sudo apt install grafana

    Сайт: grafana.com

  • Netdata
    Всё-в-одном решение: сбор метрик, визуализация, алертинг, без дополнительной настройки.
    Установка:

    bash <(curl -Ss https://my-netdata.io/kickstart.sh)

    Сайт: netdata.cloud


5. Мониторинг логов

  • ELK Stack (Elasticsearch, Logstash, Kibana)
    Платформа для агрегации и анализа логов.
    Установка: через пакеты или Docker.
    Сайт: elastic.co

  • Graylog
    Альтернатива ELK с упрощённой архитектурой.
    Установка: docs.graylog.org

  • Loki + Promtail + Grafana
    Лёгковесный стек для логов от Grafana Labs.
    Установка через Helm или бинарники: grafana.com/oss/loki

  • journalctl
    Просмотр системных журналов systemd (локально).
    Пример: journalctl -u nginx --since "1 hour ago"


6. Мониторинг инфраструктуры и облачных сред

  • Zabbix
    Полномасштабная система мониторинга с поддержкой алертинга, карт, SLA.
    Установка:

    # Ubuntu 22.04
    wget https://repo.zabbix.com/zabbix/6.0/ubuntu/pool/main/z/zabbix-release/zabbix-release_6.0-4+ubuntu22.04_all.deb
    sudo dpkg -i zabbix-release_6.0-4+ubuntu22.04_all.deb
    sudo apt update && sudo apt install zabbix-server-mysql zabbix-frontend-php zabbix-apache-conf zabbix-sql-scripts zabbix-agent

    Сайт: zabbix.com

  • Nagios Core
    Классическая система мониторинга доступности хостов и служб.
    Установка:

    sudo apt install nagios3

    Сайт: nagios.org

  • Checkmk
    Современная платформа с агентами и автоматическим обнаружением сервисов.
    Установка: через .deb/.rpm или Docker.
    Сайт: checkmk.com

  • Datadog, New Relic, Dynatrace
    Коммерческие SaaS-решения с агентами для облачных и гибридных сред.
    Регистрация и установка — через веб-интерфейс поставщика.


7. Алертинг и уведомления

  • Alertmanager (Prometheus)
    Обработка, группировка и маршрутизация алертов.
    Входит в экосистему Prometheus.

  • Grafana Alerting
    Встроенный механизм оповещений в Grafana (начиная с версии 8.0).

  • PagerDuty, Opsgenie, Slack, Telegram
    Интеграции для отправки уведомлений. Подключаются через вебхуки или API.


8. Лёгковесные утилиты для быстрой диагностики

  • stress-ng — генерация нагрузки для тестирования стабильности.
    Установка: sudo apt install stress-ng

  • sysbench — тестирование CPU, памяти, дисков.
    Установка: sudo apt install sysbench

  • iperf3 — измерение пропускной способности сети.
    Установка: sudo apt install iperf3

  • mtr — комбинация ping и traceroute.
    Установка: sudo apt install mtr