Перейти к основному содержимому

Управление жизненным циклом обращений

Разработчику Архитектору Инженеру

Управление обращениями

В ITSM обращения чаще всего относят к одному из типов ниже. Жизненный цикл регистрации и закрытия — в Приём и обработка обращений; разбор симптомов и RCA — в Диагностика и решение. Практики ITIL — 7.16 / ITIL.

ТипСутьЦель процессаПример
ИнцидентНезапланированное нарушение или риск нарушения услугиБыстро восстановить сервис"Не отправляется форма заявки"
Запрос на обслуживание (ЗНО)Стандартная услуга по каталогуВыполнить запрос в срок"Выдать доступ к папке Finance"
КонсультацияЗапрос информации без изменения системыДать ответ / ссылку на KB"Как экспортировать отчёт?"
Проблема (Problem)Корневая причина одного или многих инцидентовУстранить причину, чтобы сбои не повторялись"LDAP ломается после каждого деплоя auth"

Главный смысл этой классификации — разделить цели процессов. Инцидент управляется на скорость восстановления, запрос на обслуживание — на выполнение по регламенту, консультация — на качество объяснения, Problem record — на предотвращение повторов. Когда эти типы смешиваются, команда одновременно пытается "срочно чинить", "выполнять сервисный запрос" и "делать RCA", что перегружает поддержку и размывает SLA.


Инцидент

Инцидент — это любое незапланированное событие, которое приводит к полному или частичному нарушению нормальной работы ИТ-услуги или угрожает её стабильности. Основная цель при работе с инцидентом — как можно быстрее восстановить работоспособность сервиса, минимизировав влияние на бизнес.

Инциденты носят реактивный характер: они возникают спонтанно и требуют немедленного вмешательства. Причины могут быть разными — ошибка пользователя, дефект программного кода, сбой оборудования, сетевая аномалия, внешняя атака и т.д.

ITIL 4 определяет инцидент как любое событие, которое вызывает или может вызвать прерывание предоставления услуги или снижение её качества.


Примеры

Примеры инцидентов:

КатегорияПример
СерверыПадение сайта, недоступность API
АвторизацияПользователь не может войти в систему
Базы данныхОшибка чтения/записи, потеря данных
СетьПроблемы с подключением, DDoS-атаки
ПриложенияКраш программы, ошибка выполнения команды

Управление инцидентами

Существует процесс управления инцидентами (Incident Management), цель которого как раз таки эффективное и своевременное реагирование на инцидент с быстрым восстановлением работоспособности системы. Это процесс, направленный на быструю идентификацию, регистрацию, диагностику, временное или окончательное решение, закрытие инцидента. Цель — восстановить сервис. Глубокий анализ первопричины выносится за рамки Incident Management и передаётся в Problem Management.


Запрос на обслуживание

Запрос на обслуживание (Service Request) — запланированное обращение, связанное с предоставлением стандартной ИТ-услуги, изменением конфигурации или использованием существующих возможностей системы. В отличие от инцидента, он не связан с отказом или сбоем и выполняется в рамках заранее определённых процедур.

Такие запросы предсказуемы, стандартизированы и часто автоматизированы. Они регулируются процессом Request Fulfilment, который обеспечивает их выполнение в установленные сроки и с соблюдением политик безопасности и доступа.


Пример

Примеры запросов на обслуживание:

КатегорияПример
Управление доступомДобавление нового пользователя, изменение прав
НастройкаИзменение параметров системы, конфигурация интеграций
ОбучениеЗапрос на проведение обучения сотрудников
ДокументацияПолучение справочных материалов, отчетов
АктуализацияОбновление программного обеспечения, смена тарифа

Управление запросами

Управление запросами (Request Fulfilment) является процессом, целью которого выступает выполнение запроса в срок и в соответствии с установленными стандартами. Часто реализуется через каталог услуг (Service Catalog), может обрабатываться автоматически (например, self-service portal), имеет фиксированный workflow и SLA, но обычно менее жёсткие, чем для инцидентов.

Если пользователь пишет: "Я не могу отправить документ", это инцидент — нужно срочно разобраться. А если он пишет: "Как добавить нового пользователя?", это запрос на обслуживание — можно дать инструкцию или направить в KB. Причём, это даже можно квалифицировать как консультацию, что будет ещё проще.


Консультации

Хотя в ITIL консультации не выделены как отдельный тип, на практике они составляют значительную долю обращений. Консультация — это запрос информации, не требующий изменения состояния системы или вмешательства в инфраструктуру.

Примеры — "Как экспортировать отчёт?", "Есть ли мобильное приложение?", "Где находится настройка уведомлений?". Бывают системы, где консультаций просто нет, и пользователи хорошо знают предметную часть и ориентируются в системе.

В зрелых продуктах доля консультаций может достигать большинства обращений — особенно если интерфейс сложный или нет встроенной справки. Консультации часто оформляют как подтип ЗНО или отдельную категорию в портале. Нагрузка обычно ниже, чем у инцидентов: ответ — ссылка на KB, короткая инструкция или макрос.

Правильная классификация важна для SLA: сообщение "не могу отправить документ" — инцидент (срочно, P2/P1 при массовости); "как добавить пользователя" — ЗНО или консультация (стандартный workflow, мягче SLA, часто самообслуживание).


Проблемы

Важно понимать, что инцидент ≠ проблема. Инцидент — это симптом, а проблема — это скрытая, потенциальная или реальная корневая причина одного или нескольких инцидентов.


Управление проблемами

Процесс управления проблемами (Problem Management) направлен на долгосрочное устранение источников сбоев. К примеру, 50 пользователей не могут войти в систему, и анализ показывает, что ошибка повторяется при каждом обновлении конфигурации. Корневая причина (RCA — Root Cause Analysis): после обновления шаблона конфигурации в CI/CD pipeline некорректно применяются настройки LDAP-синхронизации.

Значит, инциденты и проблемы связаны. Выделяют следующие виды связей:

  • Иерархические: одна родительская проблема порождает множество дочерних инцидентов.
  • Параллельные: одна скрытая ошибка вызывает разные проявления в разных сервисах.
  • Каскадные: сбой в одном компоненте приводит к цепочке инцидентов в зависимых системах.

Координатор

Координатор проблемы (Problem Manager) — специалист, отвечающий за идентификацию потенциальных проблем, организацию расследования (investigation), проведение RCA, контроль внедрения постоянных решений.

Современные системы управления ИТ-услугами (например, ServiceNow, Jira Service Desk, Zendesk) позволяют автоматически определять тип обращения, назначать приоритет, перенаправлять в нужный отдел, предлагать готовые решения из базы знаний и отслеживать выполнение по SLA (Service Level Agreement). AI и NLP помогают классифицировать обращения уже на этапе создания тикета, что значительно ускоряет дальнейшую обработку.


Типовые ошибки классификации и их последствия

Ошибки в типе обращения быстро накапливают операционные потери. На практике особенно критичны:

  • инцидент оформлен как консультация и теряет приоритет;
  • запрос на обслуживание оформлен как инцидент и перегружает "аварийную" очередь;
  • повторяющийся инцидент не связан с Problem record.

Последствия заметны в метриках — растёт MTTR, падает SLA Compliance, увеличивается количество повторных обращений. Система начинает выглядеть "медленной", хотя проблема лежит в первичной сортировке.


Как построить единые правила жизненного цикла

Для согласованной работы команд полезно закрепить единый регламент:

  1. Единая таксономия типов, категорий и подкатегорий.
  2. Матрица приоритизации Impact/Urgency.
  3. Правила эскалации между L1/L2/L3.
  4. Требования к закрытию тикета и сбору обратной связи.

Операционную реализацию этих шагов можно связать с материалами Приём и обработка пользовательских обращений, Уровни технической поддержки и Оценка качества обслуживания пользователей.