AgentOps — операции с ИИ-агентами
AgentOps — практики и инструменты для развёртывания, наблюдаемости, безопасности и сопровождения LLM-агентов в реальной эксплуатации. Если DevOps отвечает за путь кода от коммита до прода, AgentOps — за путь автономных решений модели от промпта до side effect: вызов API, коммит в Git, деплой, изменение инфраструктуры.
Агент — составная система: планировщик, контекст, tools, память, guardrails. Классический мониторинг «CPU и HTTP 500» не показывает, почему агент выбрал terraform destroy или трижды дернул платный enrichment API. AgentOps делает видимыми шаги рассуждения, цепочки tool calls и стоимость каждого run.
Эволюция Ops-ландшафта
| Эпоха | Подход | Что автоматизировали |
|---|---|---|
| До 2010-х | Разрозненные Ops-команды | Ручное администрирование, медленные релизы |
| Конец 2000-х — сейчас | DevOps | CI/CD, IaC, collaboration dev + ops |
| 2016–2024 | MLOps | Версии моделей, датасеты, inference-пайплайны |
| 2010-е — сейчас | AIOps | ML на логах и метриках IT: аномалии, корреляция инцидентов |
| 2024–сейчас | AgentOps | Жизненный цикл агентных систем: tracing, eval, guardrails, multi-agent |
DevOps и MLOps закрывают детерминированный артеfact: код и веса модели. AIOps помогает людям быстрее разбирать инциденты в классической инфраструктуре. AgentOps нужен там, где сам исполнитель — вероятностная модель с tools: поддержка, codegen, trading, internal automation.
Суть AgentOps
AgentOps покрывает весь жизненный цикл агента — от одного tool call до мультиагентного workflow.
Чем отличается от соседних дисциплин
| Дисциплина | Фокус | Типичный артеfact |
|---|---|---|
| DevOps | Сборка, тесты, деплой приложения | Docker-образ, Helm chart, pipeline YAML |
| MLOps | Обучение и inference модели | Checkpoint, feature store, batch job |
| AIOps | Анализ телеметрии IT-систем | Alert, root-cause hint для SRE |
| AgentOps | Поведение агента в runtime | Trace шагов, eval метрик, approval gate |
ИИ-часть добавляет к DevOps-pipeline:
- недетерминизм — один промпт, разные планы и коммиты;
- стоимость по токенам и API — runaway loop может сжечь бюджет за часы;
- autonomy — агент сам выбирает tools и порядок шагов;
- shared accountability — владелец агента, провайдер LLM, автор MCP-сервера.
Инфраструктура, CI/CD и IaC остаются: агенты коммитят в тот же Git, проходят те же GitHub Actions, деплоят через те же стратегии выката. AgentOps надстраивается — observability агентских run, политики полномочий, eval перед merge.
Теоретическая рамка
Ops как эволюция абстракций
Каждая волна Ops инкапсулирует новый класс сложности:
DevOps решил проблему handoff между dev и ops через automation и shared ownership. MLOps — проблему non-code artifacts (data, weights). AIOps — volume телеметрии IT, непонятной человеку без ML-assisted RCA. AgentOps — agency: система сама выбирает действия в открытом мире API.
Подробно по слоям LLM-стека: MLOps L1–3, AgentOps L4–7.
Compound AI systems
Современный агент — compound system (Andrew Ng, industry term): LLM + retriever + tools + policies + human. Отказ любого компонента — отказ системы. AgentOps трассирует dependency graph run'а, аналог distributed tracing в microservices (Service Mesh).
Accountability chain
При инциденте «агент удалил данные» расследование проходит цепочку:
- Какой prompt version и rules?
- Какой tool и permission grant?
- Какой MCP server version?
- Какой model и provider policy?
- Был ли human approval?
Shared accountability означает: владелец продукта, platform team и vendor LLM совместно несут ответственность за границы системы — но operational owner один, с runbook.
Pipeline автоматизации AgentOps
Непрерывный цикл из шести стадий (по AIMultiple — AgentOps):
| Стадия | Задача | Пример |
|---|---|---|
| Observe | Запись LLM calls, tools, DB queries, межагентных сообщений | Trace в Langfuse |
| Collect metrics | Success rate, latency, cost, quality | Dashboard «$ за PR» |
| Detect issues | Timeout, guardrail violation, loop | Alert на 50 tool calls подряд |
| Root cause | Связать с промптом, контекстом, координацией | «Reviewer-агент не получил diff» |
| Optimize | Уточнить prompt, workflow, model routing | Переключить coder на более дешёвую модель |
| Automate | Self-healing: retry, fallback prompt | Auto-rollback деплоя по метрикам SLO |
Этот цикл дополняет, а не заменяет классический CI/CD: pipeline по-прежнему гоняет lint и тесты; AgentOps отвечает за качество и безопасность решений, которые агент принял до push.
Операционные вызовы
Сложные артеfact'ы. Агент порождает и статику (workflow, goals в репозитории), и runtime (планы, промежуточные рассуждения). Нужна трассировка через все компоненты — см. Инструменты AgentOps.
Высокая автономия. Агент выбирает внешние API динамически. Без allow-list и MCP возможен вызов небезопасного endpoint.
Неконтролируемое потребление API. Lead-gen агент, который в цикле дергает enrichment API, за сутки может набить счёт на тысячи долларов. Обязательны budget caps, rate limits, max_iterations.
Недетерминизм. Два run с одним промптом — разные PR. Версионирование промптов, rules и skills, eval suite в CI.
Непрерывная эволюция. Агент «учится» на feedback. Нужны regression eval и human-in-the-loop на деструктивных операциях — см. Опасные скрипты.
Эпистемологический разрыв
Оператор видит outputs (коммит, API response), модель оперирует statistical patterns. Post-mortem без trace сводится к guesswork. AgentOps — попытка построить operational epistemology: какие evidence достаточны, чтобы считать run «понятным» и «безопасным для повтора».
Как начать
- Зафиксировать контекст — AGENTS.md, rules, skills в репозитории.
- Подключить tracing — хотя бы один run log на сессию (2154).
- Ограничить полномочия — sandbox shell,
git_writeтолько на feature-ветках, deploy только через CI после merge. - Встроить eval в pipeline — smoke-тесты на golden tasks перед auto-merge.
- Human-in-the-loop на prod, секретах,
force push, IaCapply.
Дальше по главе: мультиагентные команды · контекст и среда · инструменты.
См. также
- MLOps и LLM-стек — слои 1–3
- AgentOps и LLM-стек — слои 4–7
- Вайб-кодинг — риски merge без review
- Семь слоёв LLM-стека — архитектурная карта
- AIMultiple — Top AgentOps Tools
См. также
Другие статьи этого же раздела в боковом меню (как на странице "О разделе"). Часто можно запутаться в понятиях вроде прод, тест и тому подобное — основы DevOps простым языком. Непрерывная интеграция — это практика разработки программного обеспечения, при которой изменения, вносимые разработчиками в общий репозиторий исходного кода, автоматически и регулярно объединяются. Развёртывание — доставка новой версии на сервер; стратегия — правила, как переключить пользователей со старой версии на новую без простоя и с откатом. Git — точка входа в CI/CD: коммит, ветка и pull request запускают сборку, тесты и выкат; ниже — Git Flow, хуки и GitOps. Approvals и deployment gates в GitHub Actions и Azure Pipelines: разделение зон ответственности между разработкой и эксплуатацией. Пайплайн — цепочка от планирования и коммита до мониторинга на проде: CI (сборка, тесты), CD (релиз, деплой) и типичные инструменты этапов. Azure Repos — Git и TFVC в Azure DevOps: репозитории, pull request, политики веток и связь с CI/CD. Автоматизация и наблюдаемость - стек ELK для сбора, индексации и анализа логов (Elasticsearch, Logstash, Kibana). Смешение терминов системный администратор и DevOps-инженер — чем роли отличаются на практике. Автоматизация представляет собой систематическое применение программных и аппаратных средств для выполнения задач без или с минимальным участием человека. Логирование и мониторинг в CI/CD необходимы для автоматизации процессов и обеспечения качества, позволяя отслеживать ход пайплайна и быстро выявлять проблемы. Terraform — это программа, которая позволяет описать всю вашу инфраструктуру в текстовых файлах, а потом одной командой создать её в облаке или локально.Основы DevOps
CI/CD. Принципы непрерывной интеграции и доставки
Стратегии развертывания
Использование Git и GitFlow в DevOps-процессах
Особенности настройки и эксплуатации CI/CD-конвейеров
Жизненный цикл пайплайна CI/CD
Azure Repos и Team Foundation Server (TFS)
Инструменты автоматизации и оркестрации
Роль DevOps-инженера и отличия от системного администратора
Автоматизация сборки, тестирования и развёртывания
Логирование, мониторинг и наблюдаемость систем
Terraform