Перейти к основному содержимому

Системное администрирование — итоги

Разработчику Аналитику Тестировщику Архитектору Инженеру

Кратко — что стоит унести из раздела "Системное администрирование". Если пункт кажется туманным — откройте указанную главу или оглавление.


FAQ — Часто задаваемые вопросы

Типичные сбои и ситуации, с которыми сталкиваются новички после раздела. Здесь — что делать и где копать в главах; определения для самопроверки — в чек-листе.

Вопрос. После "чистой" переустановки Windows сервер не загружается — чёрный экран или цикл перезагрузки.

Ответ. Сверьте режим загрузки и разметку диска (UEFI + GPT или Legacy + MBR), порядок boot в BIOS, загрузочную флешку и последние изменения перед установкой. Для восстановления загрузчика нужна установочная среда, а не повторное форматирование "наугад". Подробнее здесь — установка ОС, жизненный цикл Windows.

Вопрос. Установщик Linux ругается на диск или не видит RAID-массив.

Ответ. Проверьте, видит ли установщик контроллер и драйвер, выбран ли правильный диск (не флешка), достаточно ли свободного места и совпадает ли схема разделов с планом (/boot, /, swap). Подробнее здесь — установка ОС, ИТ-инфраструктура.

Вопрос. "Доверительные отношения с доменом" сломались — ПК не входит под доменной учёткой.

Ответ. Частая причина — рассинхрон времени, давний клон образа, смена имени ПК без перепривязки. Проверьте NTP, связь с контроллером домена, переподключение к домену по процедуре из документации (с локальной учёткой администратора). Подробнее здесь — рабочие станции, серверы и AD.

Вопрос. Ввёл ПК в домен, а политики и общие папки "как на домашнем".

Ответ. Выполните gpupdate /force, перезагрузку, проверьте OU, применённые GPO и фильтры безопасности. Убедитесь, что DNS указывает на контроллер домена, а не на роутер. Подробнее здесь — групповые политики, конфигурация рабочих станций.

Вопрос. Общая папка видна в сети, но "Отказано в доступе" при открытии файла.

Ответ. Разделите права шары SMB и NTFS на диске — эффективные права = пересечение. Проверьте группу пользователя, наследование и явные запреты. Подробнее здесь — серверы, рабочие станции.

Вопрос. Сайт открывается по IP, по имени — "не найден" только на новом Linux-сервере.

Ответ. Проверьте /etc/resolv.conf, systemd-resolved, корпоративный DNS и записи в /etc/hosts. Сверьте nsswitch.conf. Подробнее здесь — сеть и диагностика, настройка серверов.

Вопрос. Внутри офиса сервис доступен, с интернета — таймаут, хотя "порт проброшен".

Ответ. Пройдите цепочку: служба слушает нужный интерфейс → правило на роутере → внешний IP (не CGNAT) → брандмауэр на хосте → провайдер не блокирует порт. Проверьте с внешней сети (curl, онлайн-проверка порта). Подробнее здесь — NAT и проброс, домашняя сеть.

Вопрос. Проброс порта настроен, с телефона через LTE всё равно не коннектится.

Ответ. У части провайдеров CGNAT — белого IP нет, проброс с роутера бесполезен. Нужен VPS, VPN-туннель или услуга статического IP. Подробнее здесь — NAT и проброс, сетевые аномалии.

Вопрос. ping до шлюза есть, до 8.8.8.8 — нет: где обрыв?

Ответ. Локальная сеть жива, проблема выше шлюза — маршрут по умолчанию, DHCP, WAN-линк, DNS. Идите слоями: интерфейс → шлюз → интернет → имя. Подробнее здесь — сеть и диагностика, сетевые аномалии.

Вопрос. Открыл порт в брандмауэре Windows, подключение всё равно отваливается.

Ответ. Уточните профиль сети (домен/частная/публичная), правило для нужного профиля, службу на 0.0.0.0 vs 127.0.0.1, второй брандмауэр (антивирус, облако). Подробнее здесь — сеть и диагностика, диагностика ошибок.

Вопрос. На Linux "chmod 777" на каталог — и всё равно "Permission denied".

Ответ. Смотрите владельца, группу, ACL, SELinux/AppArmor, каталог выше по пути (нужен x на родителях). 777 на файл не чинит отсутствие прав на каталог. Подробнее здесь — администрирование Linux.

Вопрос. Скрипт в cron "молчит", вручную из SSH работает.

Ответ. У cron другой PATH, пользователь, окружение. Укажите полные пути, перенаправьте stderr в лог, проверьте права на скрипт и shebang. Подробнее здесь — планирование задач, Linux.

Вопрос. Служба systemd в цикле restart — сервис "вроде запущен", клиенты падают.

Ответ. Читайте journalctl -u имя -e, лимиты Restart=, зависимости (сеть, диск, БД). Временно остановите автоперезапуск, устраните первопричину в логе. Подробнее здесь — планирование и автоматизация, диагностика ошибок.

Вопрос. Диск заполнен на 100%, удалил гигабайты логов — место не появилось.

Ответ. Файл мог остаться открытым процессом — место освободится после ротации/перезапуска службы или truncate. Проверьте df, du, inode (df -i). Подробнее здесь — диагностика ошибок, мониторинг, диагностика Linux.

Вопрос. Ночью "упала" база PostgreSQL — в логе OOM-killer.

Ответ. Сверьте лимиты памяти, swap, конкуренцию с другими сервисами на том же хосте. Настройте мониторинг RAM, алерт до OOM, лимиты cgroup. Подробнее здесь — СУБД в администрировании, диагностика производительности.

Вопрос. После перезагрузки сервера PostgreSQL не принимает подключения.

Ответ. Проверьте автозапуск unit, место на диске, целостность данных, pg_hba.conf, слушает ли postgresql нужный адрес. Смотрите лог кластера и systemctl status. Подробнее здесь — работа с БД, диагностика ошибок.

Вопрос. Бэкап "есть каждый день", а восстановление на тесте провалилось.

Ответ. Резервная копия без проверенного restore остаётся гипотезой. Регулярно поднимайте копию на стенде, фиксируйте RPO/RTO, храните off-site. Подробнее здесь — резервные копии, восстановление из бэкапов.

Вопрос. Удалили файл по ошибке, бэкапа не было — "можно ли вытащить"?

Ответ. Сразу минимизируйте запись на диск (отмонтируйте раздел, не ставьте утилиты "восстановления" на тот же том). Шансы зависят от ФС и активности после удаления. Подробнее здесь — восстановление без бэкапов, как хранятся файлы.

Вопрос. В Zabbix хост "недоступен", хотя по SSH сервер отвечает.

Ответ. Проверьте агент, firewall, DNS-имя хоста, шаблон и интервал опроса, отличие IP в инвентаре от реального. С сервера Zabbix — zabbix_get или тест порта 10050. Подробнее здесь — практикум Zabbix, мониторинг.

Вопрос. Prometheus шлёт алерты, а сайт у пользователей открывается.

Ответ. Метрика с хоста может не совпадать с опытом пользователя (blackbox, CDN, кэш, порог). Добавьте проверки снаружи, сверьте expr и for:, уберите шумные пороги. Подробнее здесь — практикум Prometheus и Grafana, галерея PromQL, мониторинг.

Вопрос. Дашборд в Grafana "зелёный", инцидент всё равно пришёл от пользователей.

Ответ. Дополните логи, трассировки, синтетические проверки и SLO по бизнес-операциям, а не только CPU/RAM. Подробнее здесь — мониторинг, практикум Grafana.

Вопрос. В логах миллионы строк за час — диск снова кончается.

Ответ. Включите ротацию (logrotate, политики Windows), уровень логирования, централизацию с retention. Найдите источник шторма (цикл ошибок, debug в проде). Подробнее здесь — мониторинг и логи, диагностика ошибок.

Вопрос. Сертификат HTTPS истёк — браузер "красный экран", паника в чате.

Ответ. Проверьте цепочку на балансировщике и origin, автообновление (ACME), напоминания за 30 дней. Временный обход только для диагностики, не как норма. Подробнее здесь — сеть, восстановление данных.

Вопрос. После смены SSH-порта перестали заходить — "Connection refused".

Ответ. Сверьте sshd_config, ListenAddress, firewall и security group под новый порт. Держите консоль out-of-band (IPMI, облачная serial) до проверки. Подробнее здесь — Linux, сеть.

Вопрос. fail2ban заблокировал мой IP во время настройки сервера.

Ответ. Разблокируйте через fail2ban-client или whitelist офисных подсетей, снизьте агрессию jail на время работ. Отключение защиты без компенсирующих мер оставляет хост открытым. Подробнее здесь — администрирование Linux, сетевые аномалии.

Вопрос. Время на сервере ушло на несколько минут — странные ошибки Kerberos и AD.

Ответ. Синхронизируйте NTP/chrony на всех участниках домена; большой skew ломает билеты. Проверьте часовой пояс отдельно от UTC в логах. Подробнее здесь — серверы, Linux.

Вопрос. SMART уже показывал "Pending sectors", диск всё равно "дожали" до отказа.

Ответ. Предупреждение SMART — сигнал заменить диск и проверить бэкап, а не "потерпеть ещё неделю". Подробнее здесь — ИТ-инфраструктура, правила работы с диском.

Вопрос. Сервер "тормозит", RAM вроде свободна, диск в 100% iowait.

Ответ. Смотрите swap, очередь диска, логи, антивирус, iotop, давление на БД. Часто виноват медленный диск или шторм записи. Подробнее здесь — диагностика производительности Linux, мониторинг.

Вопрос. Развернул клон ВМ из шаблона — в AD дубликаты имён и странная аутентификация.

Ответ. Перед вводом в домен нужны уникальные SID/hostname (sysprep на Windows, пересоздание machine-id на Linux). Подробнее здесь — рабочие станции, установка ОС.

Вопрос. Обновление Windows Server "висит" на перезагрузке сутками.

Ответ. Проверьте окно обслуживания, pending reboot, роли, место на C:, снимок/бэкап перед KB. На проде — поэтапный rollout. Подробнее здесь — Windows Server, жизненный цикл Windows.

Вопрос. Поставил роль на сервере, мастер требует перезагрузку — можно отложить месяц?

Ответ. Отложенная перезагрузка копит незавершённую конфигурацию и сюрпризы при следующем патче. Запланируйте reboot в окно, проверьте зависимые службы. Подробнее здесь — Windows Server, настройка серверов.

Вопрос. Синхронизация Entra ID / гибрид — пользователи есть в облаке, в on-prem нет (или наоборот).

Ответ. Смотрите коннектор, OU фильтры, ошибки sync в портале, конфликт UPN и дубликаты. Подробнее здесь — Entra и RBAC, серверы.

Вопрос. "Странный" трафик и неизвестные процессы — это уже взлом?

Ответ. Зафиксируйте время, IP, имя процесса, хэш файла, изолируйте сегмент, сохраните артефакты до снимка. Сверьте с легитимными агентами (мониторинг, обновления). Подробнее здесь — сетевые аномалии, администрирование.

Вопрос. На учебном стенде всё работало, в проде "упало" после выката — с чего начать разбор?

Ответ. Соберите таймлайн изменений (деплой, конфиг, firewall, DNS), логи приложения и ОС, метрики за тот же интервал. Откатите или зафиксируйте версию, если SLA горит. Подробнее здесь — диагностика ошибок, роли администратора.

Вопрос. Коллега "починил" прод, правя конфиг вручную на сервере — через неделю снова сломалось.

Ответ. Без документации и версионирования конфигов знание остаётся в чате. Зафиксируйте diff, вынесите в Git/Ansible, добавьте ревью. Подробнее здесь — администрирование, планирование задач.

Частые поисковые запросы

Формулировки, близкие к запросам в Google и Яндексе — краткий ответ и ссылка на главу раздела.

Вопрос. Кто такой системный администратор и чем он занимается?

Ответ. Системный администратор (sysadmin) держит в рабочем состоянии серверы, сеть, учётные записи, бэкапы и мониторинг — чтобы приложения и пользователи могли работать. Это не только "переустановка Windows", а проектирование, безопасность и документация. Подробнее здесь — администрирование.

Вопрос. Чем Windows Server отличается от обычной Windows на ПК?

Ответ. Windows Server заточена под роли в сети — Active Directory, DNS, DHCP, файловые службы, политики; лицензирование и интерфейс другие. Домашняя Windows — клиент для пользователя. Подробнее здесь — Windows Server, установка ОС.

Вопрос. Как ввести компьютер в домен Active Directory?

Ответ. Нужны доступный контроллер домена, DNS на DC, права на ввод, корректное имя ПК и сеть. На клиенте — "Присоединить к домену" в свойствах системы или через GPO/скрипт. Сверьте время (NTP). Подробнее здесь — рабочие станции, настройка серверов.

Вопрос. Что такое DNS-сервер и зачем он нужен в офисе?

Ответ. DNS переводит имена (server.company.local) в IP-адреса. Без него не работают домен, почта и внутренние сервисы по имени. В AD DNS обычно на контроллере домена. Подробнее здесь — сеть и диагностика, серверы.

Вопрос. Как настроить статический IP-адрес на Windows или Linux?

Ответ. На Windows — параметры адаптера → IPv4 вручную; на Linux — Netplan, nmcli или /etc/network/interfaces в зависимости от дистрибутива. Зафиксируйте шлюз, маску и DNS. Подробнее здесь — сеть и диагностика.

Вопрос. Что такое DHCP и как понять, что он выдал адрес?

Ответ. DHCP автоматически раздаёт IP, маску, шлюз и DNS. На клиенте смотрите ipconfig /all или ip a; на сервере — leases на роутере или Windows DHCP. Конфликт адресов — частая причина "странной" сети. Подробнее здесь — сеть, домашняя сеть.

Вопрос. Как пробросить порт на роутере для домашнего сервера?

Ответ. В веб-интерфейсе роутера найдите Port Forwarding / NAT, укажите внешний порт, внутренний IP сервера и порт службы. Служба должна слушать на этом IP, брандмауэр — разрешать. У части провайдеров нет белого IP (CGNAT). Подробнее здесь — NAT и проброс, домашняя сеть.

Вопрос. Что такое NAT и почему из интернета не виден мой компьютер?

Ответ. NAT подменяет частные адреса (192.168.x.x) одним публичным — извне виден роутер, а не каждый ПК. Доступ "снаружи" — через проброс портов или VPN. Подробнее здесь — NAT и проброс.

Вопрос. Как проверить, открыт ли порт на сервере?

Ответ. На сервере — ss -tlnp / netstat, брандмауэр; с другой машины — telnet host port, nc -zv или curl для health-check, curl / fetch — примеры. Учитывайте NAT и security groups в облаке. Подробнее здесь — сеть.

Вопрос. SSH или RDP — что выбрать для удалённого администрирования?

Ответ. SSH — терминал и файлы для Linux/Unix (и Windows с OpenSSH). RDP — полный графический рабочий стол Windows. Для серверов Linux обычно SSH; для Windows Server — RDP или WinRM/PowerShell Remoting. Подробнее здесь — Linux, сеть.

Вопрос. Где смотреть логи ошибок в Linux?

Ответ. Центр — journalctl (journalctl -u служба -e), файлы в /var/log/ (syslog, auth, nginx, postgresql). Уровни: err, warning. Подробнее здесь — диагностика ошибок, мониторинг.

Вопрос. Где логи Windows и что такое Event Viewer?

Ответ. Просмотр событий (Event Viewer) — Application, System, Security; фильтр по уровню и Event ID. Для служб IIS, AD, обновлений — отдельные журналы. Подробнее здесь — ошибки и логи.

Вопрос. Как запланировать задачу по расписанию в Linux (cron)?

Ответ. Редактируйте crontab -e (пять полей: минута, час, день, месяц, день недели + команда с полным путём). Альтернатива — systemd timer. Подробнее здесь — планировщики.

Вопрос. Как сделать резервную копию базы PostgreSQL?

Ответ. Логический дамп — pg_dump; физический — base backup + WAL для point-in-time recovery. Храните копии off-site, проверяйте restore. Подробнее здесь — СУБД, резервные копии.

Вопрос. Что такое WAL в PostgreSQL простыми словами?

Ответ. Write-Ahead Log (WAL) — журнал изменений до записи на диск данных; позволяет восстановиться после сбоя и делать репликацию. Архивируйте WAL для PITR. Подробнее здесь — СУБД.

Вопрос. Zabbix или Prometheus — с чего начать мониторинг сервера?

Ответ. Zabbix — классика с агентами, шаблонами и оповещениями "из коробки". Prometheus — метрики time-series + Grafana, популярен в cloud-native. Начните с CPU, RAM, диск, доступность сервиса. Подробнее здесь — мониторинг, практикум Zabbix, практикум Prometheus, PromQL — галерея.

Вопрос. MBR или GPT — что выбрать при установке Windows или Linux?

Ответ. На современных ПК с UEFI берите GPT (диски >2 ТБ, несколько разделов). MBR — legacy BIOS и старые сценарии. Режим загрузки и разметка должны совпадать. Подробнее здесь — установка ОС.

Вопрос. Как разметить диск при установке Ubuntu Server?

Ответ. Типично: /boot (EFI при UEFI), / (корень), swap или swapfile, опционально /home. Размеры — под логи, БД и данные. Подробнее здесь — установка ОС, ИТ-инфраструктура.

Вопрос. Что такое обратный прокси nginx и зачем он перед приложением?

Ответ. Nginx как reverse proxy принимает HTTPS снаружи, балансирует на backend, отдаёт статику, режет по rate limit. Приложение слушает localhost:8080 за прокси. Подробнее здесь — сеть, мониторинг health-check, curl / fetch — примеры.

Вопрос. Docker и виртуальная машина — в чём разница?

Ответ. ВМ эмулирует целый компьютер с своей ОС. Docker-контейнер делит ядро хоста, изолирует процессы и ФС — легче и быстрее старт, но другая модель безопасности. Подробнее здесь — ИТ-инфраструктура.

Вопрос. Что такое групповая политика GPO в Active Directory?

Ответ. GPO централизованно задаёт настройки Windows — пароли, софт, диски, безопасность — на OU и группы. Применение: gpupdate /force, RSOP для диагностики. Подробнее здесь — групповые политики.

Вопрос. Как стать системным администратором с нуля — с чего учиться?

Ответ. База: сеть (IP, DNS), Linux CLI, Windows Server, бэкапы, мониторинг, безопасность. Практика — домашний сервер, VM, стажировка. Маршрут по разделу — оглавление, администрирование.

Вопрос. Правило 3-2-1 для резервных копий — что это?

Ответ. 3 копии данных, на 2 разных носителях/типах, 1 off-site (другая площадка/облако). Без проверенного restore бэкап не считается. Подробнее здесь — восстановление данных.

Вопрос. Что такое chmod 755 и rwx в Linux?

Ответ. rwx — read, write, execute для владельца, группы и остальных; 755 — владелец всё, остальные читают и входят в каталог. chmod и chown + ACL при необходимости. Подробнее здесь — Linux в админской практике.


Что запомнить

Краткая шпаргалка

  • Четыре опоры раздела: СУБД и бэкапы · мониторинг и логи · установка и конфигурация ОС · сеть (DNS, DHCP, маршрутизация, безопасность).
  • При установке систем: MBR/GPT под режим загрузки · разметка диска (/boot, /, swap, /home на Linux) · сеть до ввода в домен · на Windows — бэкап перед форматированием C: (Windows на рабочей станции — жизненный цикл).
  • Три правила: регулярные проверенные бэкапы · полноценные логи · осознанная архитектура (не "как получится").
  • Три аксиомы: у каждого компонента своя модель отказов · безопасность и наблюдаемость закладываются при проектировании · хаос в данных = хаос в эксплуатации.

Пройдите чек-лист самопроверки, если хотите закрепить темы вопросами.


Развёрнутое резюме

Системное администрирование — это целостная дисциплина, направленная на обеспечение стабильной, безопасной и предсказуемой работы информационной инфраструктуры. Она охватывает все уровни вычислительного стека: от физического оборудования до прикладных сервисов, от сетевой топологии до политик управления доступом. Администратор выступает в роли архитектора, инженера, оператора и аудитора одновременно — его задача не просто "починить то, что сломалось", а построить систему, способную противостоять сбоям, масштабироваться под нагрузкой и развиваться без катастрофических перестроек.

Центральными категориями системного администрирования являются:

  • Управление базами данных — организация, настройка, мониторинг и резервное копирование СУБД как критически важных компонентов бизнес-логики;
  • Мониторинг и логирование — сбор, анализ и интерпретация метрик и событий для обеспечения наблюдаемости, диагностики и проактивного реагирования;
  • Установка и настройка систем — развёртывание операционных систем, конфигурирование ядра, управление пакетами, настройка пользовательских сред и служб;
  • Организация сетевой инфраструктуры — проектирование топологии, адресация, маршрутизация, настройка DNS/DHCP, обеспечение безопасности трафика.

Эффективное администрирование строится на трёх фундаментальных принципах:

  1. Регулярное резервное копирование — обязательная процедура. Отсутствие актуальной, проверенной и изолированной копии данных делает любую систему уязвимой к полной потере информации.
  2. Полноценное логирование — каждый компонент должен оставлять следы своей деятельности. Логи — это источник правды при расследовании инцидентов и основа для аудита.
  3. Осознанное проектирование архитектуры — выбор между MBR и GPT, между доменом и рабочей группой, между NAT и прямым доступом — это стратегические решения, влияющие на масштабируемость, безопасность и стоимость владения.

Три ключевых аксиомы, лежащие в основе профессиональной практики:

  • Каждый компонент системы — от SSD-диска до облачного балансировщика — имеет свою специфику поведения, ограничения и модель отказов. Игнорирование этих особенностей ведёт к непредсказуемым последствиям.
  • Безопасность и мониторинг — неотъемлемые свойства любой зрелой инфраструктуры. Они закладываются на этапе проектирования, а не добавляются "поверх".
  • Правильная организация данных — файловой системы, базы данных, логов, конфигураций — напрямую определяет производительность, надёжность и удобство обслуживания. Хаос в данных неизбежно порождает хаос в эксплуатации.

Системное администрирование — это постоянный баланс между стабильностью и развитием, между автоматизацией и контролем, между изоляцией и интеграцией. Его цель — создать среду, в которой разработчики, аналитики, тестировщики и конечные пользователи могут работать эффективно, не задумываясь о "железе" и "сетях", доверяя инфраструктуре как невидимому, но надёжному фундаменту.


Куда идти дальше

ТемаРаздел
"Софт рядового пользователя — о разделе""Софт рядового пользователя — о разделе"
"Основы информационной безопасности — о разделе""Основы информационной безопасности — о разделе"
"Советы для новичка — о разделе""Советы для новичка — о разделе"
"Операционная система — о разделе""Операционная система — о разделе"

Проверьте себя: Чек-лист самопроверки.