Типы интеллектуальных агентов
В классической теории ИИ (Russell & Norvig, курс MIT, схемы вроде ByteByteGo — Types of AI Agents) интеллектуальный агент — сущность, которая через сенсоры получает восприятия (percepts) из среды, обрабатывает их и через исполнительные механизмы (actuators, effectors) отдаёт действия (actions). Чем сложнее внутренняя схема принятия решений, тем богаче поведение в частично наблюдаемой и меняющейся среде.
Современные LLM-агенты (Агенты ИИ) наследуют те же идеи: цикл «наблюдение → решение → действие», память, цели и обратная связь. Ниже — пять базовых архитектур, от которых удобно отталкиваться при проектировании.
Общая схема
| Элемент | Роль |
|---|---|
| Среда | Всё, с чем взаимодействует агент (физический мир, API, чат, база данных) |
| Сенсоры | Датчики, парсеры, webhook, чтение логов — всё, что даёт вход |
| Исполнительные механизмы | Моторы, HTTP-запросы, shell, отправка сообщения пользователю |
| Агент | Логика выбора действия по восприятиям (и, при необходимости, по внутреннему состоянию) |
1. Простой рефлексный агент
Simple reflex agent действует только по текущему восприятию, без памяти прошлых шагов.
Внутри — таблица или набор condition-action rules (правил «условие → действие»). Пример: если температура выше порога — включить вентилятор.
| Плюсы | Минусы |
|---|---|
| Простота, предсказуемость, низкая задержка | Не видит скрытое состояние среды |
| Легко тестировать | Ошибается, если одного датчика недостаточно |
Аналоги в разработке: middleware «если статус 500 — retry», простые webhook без контекста, жёсткий routing в чат-боте по ключевым словам.
2. Модельный рефлексный агент
Model-based reflex agent хранит внутреннее состояние, которое обновляется после каждого восприятия. Состояние отражает то, что сейчас не видно сенсорами, но важно для решения (где был робот, открыта ли дверь, есть ли незакоммиченные файлы в сессии).
Модель среды описывает, как мир меняется от действий агента и от внешних факторов. Правила срабатывают уже по состоянию + модели, а не по одному датчику.
| Плюсы | Минусы |
|---|---|
| Работа в частично наблюдаемой среде | Нужно поддерживать модель и синхронизацию состояния |
| Учитывает «историю» в сжатом виде | Ошибка модели накапливается |
Аналоги: сессия пользователя в веб-приложении, контекст диалога в LLM, кэш «последний известный статус заказа» перед вызовом API.
3. Целевой агент
Goal-based agent явно хранит цель (goal) и выбирает действия, которые ведут к её достижению. Вместо фиксированных «если — то» используется планирование или поиск: «что будет, если сделать A?» и «приблизит ли это к цели?».
Цель можно менять без переписывания всех правил — достаточно подставить новую спецификацию цели. Агент гибче рефлексного, но дороже по вычислениям (перебор планов, граф состояний).
Аналоги: LLM-агент с задачей «собери отчёт за квартал»; план-and-execute в Агентах ИИ; маршрутизация «доставить посылку в точку B».
4. Утилитарный агент
Utility-based agent похож на целевой, но выбирает не «любой путь к цели», а лучший по числовой функции полезности (utility). Один и тот же целевой результат может отличаться по риску, времени, стоимости или комфорту — утилита позволяет сравнивать компромиссы.
Пример: две стратегии доставки заказа — быстрая дорогая и медленная дешёвая; цель одна («доставить»), утилита взвешивает время, деньги и репутацию.
Аналоги: ранжирование ответов RAG по score; выбор модели по цене/latency; multi-objective оптимизация в MLOps.
5. Обучающийся агент
Learning agent улучшает поведение со временем в неизвестной или меняющейся среде. Классическая схема делит агента на четыре блока:
| Компонент | Назначение |
|---|---|
| Элемент производительности | То, что во внешнем мире выглядит как «агент» (как в типах 1–4) |
| Элемент обучения | Улучшает элемент производительности по обратной связи |
| Критик | Сравнивает наблюдаемые исходы со стандартом производительности |
| Генератор задач | Предлагает эксперименты — действия ради нового опыта, даже если они субоптимальны сейчас |
Такой агент сочетает эксплуатацию (делать лучшее известное) и исследование (пробовать новое). Подробнее про награды и среду — обучение с подкреплением и нейросети — обучение с подкреплением.
Аналоги: fine-tuning и RLHF; A/B тесты промптов; агент, который по логам ошибок дополняет allow-list инструментов.
Сравнение типов
| Тип | Память / состояние | Цель | Оценка вариантов | Обучение |
|---|---|---|---|---|
| Простой рефлексный | нет | в правилах | нет | нет |
| Модельный рефлексный | да | в правилах | нет | нет |
| Целевой | да | явная цель | поиск / план | нет |
| Утилитарный | да + прогноз | цель + компромиссы | функция полезности | нет |
| Обучающийся | да | стандарт + цели обучения | критик + эксперименты | да |
Сложность и гибкость растут сверху вниз; и стоимость ошибки, и требования к данным и наблюдаемости — тоже.
Связь с LLM-агентами
Современный LLM-агент (Агенты ИИ) обычно совмещает несколько уровней сразу:
| Классический тип | Где проявляется в LLM-стеке |
|---|---|
| Рефлексный | Жёсткие guardrails, «если tool = delete — спроси человека» |
| Модельный | Контекст чата, RAG, профиль пользователя |
| Целевой | Системный промпт с задачей, ReAct, plan-and-execute |
| Утилитарный | Выбор модели, temperature, ранжирование документов |
| Обучающийся | LoRA, eval-наборы, разбор логов агента в проде |
Практический вывод: перед внедрением агента полезно явно ответить — достаточно ли правил по текущему входу, нужна ли память состояния, как сформулирована цель, по какой метрике сравнивать планы и где будет обратная связь для улучшения.
Итоги
Пять типов — лестница выразительности, а не взаимоисключающие продукты. Простой рефлекс покрывает автоматику с полным наблюдением; модель и цели нужны в частично наблюдаемых задачах; утилита — когда важны компромиссы; обучение — когда среда или предпочтения меняются быстрее, чем успевают обновлять правила вручную. LLM-агенты в продакшене почти всегда строят на комбинации этих слоёв плюс инженерный контроль цикла и прав.
См. также
Другие статьи этого же раздела в боковом меню (как на странице "О разделе"). Большая языковая модель (Large Language Model, LLM) — это класс машинных моделей глубокого обучения, предназначенный для обработки естественного языка и генерации связных текстов, соответствующих по. При компрометации одного агента ущерб ограничен его полномочиями — это реализация принципа минимальных привилегий. Стратегический подход, когда ИИ становится центральным элементом проектирования, разработки и функционирования. Сегодня генеративные нейросети стали рабочим инструментом широкого круга специалистов: программисты используют их для генерации кода и документации, юристы — для составления шаблонов договоров. Model Context Protocol — ресурсы, tools и prompts для LLM; сравнение с классическим HTTP API. Автономные тестовые агенты обладают способностью к постоянному совершенствованию. Этот процесс основан на сборе данных о результатах работы и применении методов машинного обучения. Агент ИИ — система, где языковая модель не только отвечает текстом, но и выбирает действия: вызвать API, выполнить запрос к БД, открыть тикет, сгенерировать файл. Практика работы с тремя семействами LLM для кода: когда какой сервис выбрать, структура промпта, проверка результата и связка с IDE-агентами. Семь основных настроек при вызове LLM: max tokens, temperature, top_p, top_k, frequency и presence penalty, stop — что делают и типичные значения. Как слой знаний (RAG), слой подключений (MCP) и слой исполнения (AI-агент) складываются в архитектуру современного ИИ-приложения. Итоги раздела Модели и инструменты — вопросы для самопроверки в энциклопедии Вселенная IT.Большие языковые модели и ChatGPT
ИИ-агенты
Подход AI First в разработке продуктов
Признаки использования нейросетей в цифровых продуктах
MCP-серверы
Автономные тестовые агенты
Агенты искусственного интеллекта
Генерация кода — ChatGPT, Gemini и DeepSeek
Параметры генерации LLM — напоминалка
RAG, MCP и агенты — три слоя архитектуры
Чек-лист самопроверки