Перейти к основному содержимому

RAG, MCP и агенты — три слоя архитектуры

Архитектору Разработчику Аналитику

В продакшене на одной LLM редко останавливаются. Типичное приложение собирают из трёх паттернов, которые решают разные задачи и часто работают вместе. Схема в духе ByteByteGo — MCP, RAG and AI Agents удобна как «шпаргалка архитектора»: что за что отвечает и куда смотреть в ТЗ.

СлойПаттернВопрос, на который отвечает
ЗнанияRAG (Retrieval-Augmented Generation)Откуда модель берёт факты о ваших документах и данных?
ПодключенияMCP (Model Context Protocol)Как модель единым способом достучится до API, БД и файлов?
ИсполнениеAI-агентКто планирует шаги, вызывает инструменты и реагирует на результат?

Три паттерна дополняют друг друга: RAG подмешивает текст в промпт, MCP стандартизирует доступ к внешнему миру, агент замыкает цикл «решение → действие → наблюдение». В семи слоях LLM-стека RAG и агенты сидят в основном на слое 4 (оркестрация); MCP — на стыке слоёв 4 и 6 (интеграция).


RAG — слой знаний

RAG — это дополнение генерации поиском: LLM получает не только вопрос пользователя, но и релевантные фрагменты из вашей базы знаний (PDF, wiki, тикеты, код, векторный индекс).

Задача RAG — ответы по внутренним материалам без дообучения всей модели на каждый новый документ. Модель остаётся «общей», а актуальные цитаты подставляются на время запроса.

Типичные источники в базе знаний:

  • корпоративные PDF и Markdown;
  • векторные БД (эмбеддинги чанков) — см. Векторные базы данных;
  • репозитории кода и API-спеки;
  • иногда — полнотекстовый поиск (Elasticsearch и аналоги) вместе с векторным.

Этапы внедрения (кратко): индексация и чанкинг → эмбеддинги → retriever по запросу → сборка промпта → генерация. Подробнее — в Генеративном ИИ, Работе с ИИ-моделями и Основах разработки ИИ-решений.

Граница ответственности RAG
RAG читает и цитирует. Создание тикета, запись в Git или отправка письма — зона агента или отдельного orchestration-кода с вызовом API.


MCP — слой подключений

MCP — стандартный способ дать LLM доступ к инструментам и ресурсам через единый протокол. Хост (IDE, десктоп с Claude, корпоративный агент) подключает один или несколько MCP-серверов; каждый сервер объявляет, что можно прочитать (resources), вызвать (tools) и какие шаблоны промптов (prompts) доступны.

Примеры «серверов по буквам» из типовых схем:

СерверЧто даёт модели
AREST и SaaS — issues, сообщения, календарь
BSQL/NoSQL — выборки и отчёты по схеме с ограничениями
CФайлы — чтение конфигов, логов, репозитория в песочнице

MCP дополняет продуктовый REST: мобильное приложение по-прежнему ходит в ваш бэкенд; MCP-сервер может быть тонкой обёрткой с allow-list операций для агента. Сравнение с классическим API — в MCP и классический API; развёртывание и безопасность — в статье MCP-серверы.


AI-агент — слой исполнения

AI-агент (в смысле LLM-агента) — система, где модель принимает решения и выполняет действия: вызвать tool, перепланировать шаг, запомнить результат, повторить цикл. Это исполнительный слой поверх «голого» чата.

Характерные свойства:

СвойствоСмысл
АвтономностьНесколько шагов без ручного ввода на каждый вызов API
ПамятьКраткая (контекст) и долгая (векторное хранилище, профиль)
ИнструментыFunction calling, MCP tools, выполнение кода в песочнице
РеактивностьНовое наблюдение меняет следующий шаг (ошибка SQL, пустой ответ API)

Классическая таксономия агентов (рефлекс, модель среды, цели) — Типы интеллектуальных агентов. Практика LLM-агентов, ReAct, безопасность tool calls — Агенты искусственного интеллекта.


Как слои складываются в одном продукте

Типичный корпоративный copilot может выглядеть так:

  1. RAG подтягивает регламенты и фрагменты тикетов в промпт.
  2. MCP даёт агенту ограниченный доступ к Jira, Confluence и внутренней БД.
  3. Агент решает, нужен ли только ответ или цепочка действий («создай черновик отчёта и приложи к задаче»).

Поддержка по базе знаний — чаще достаточно RAG + низкая temperature (параметры генерации), без агента.

Автоматизация с побочными эффектами (запись в БД, деплой, платежи) — нужен агент с жёсткими политиками; RAG и MCP — его «глаза» и «руки».

IDE с Cursor / Claude DesktopMCP подключает репозиторий и API; агентский цикл встроен в хост; RAG по проекту может быть частью индексации IDE или отдельным MCP-resource.


Что выбрать на старте

СценарийДостаточноПочему
FAQ по внутренней wikiRAGНет действий во внешних системах
Чат с доступом к GitHub issuesMCP (+ простой промпт)Нужны tools, мало автономии
«Собери отчёт и загрузи в SharePoint»Агент + MCP (+ опционально RAG)Многошаговый план и побочные эффекты
Классификация писемНи RAG, ни MCP, ни агентДостаточно fine-tuned модели или правил

Порядок внедрения
Сначала RAG на качественных чанках и eval-наборе вопросов. Затем MCP с минимальным allow-list tools. Агент включайте, когда появляются сценарии с инструментами и принят риск-профиль (лимиты итераций, human-in-the-loop, Опасные скрипты).


Итоги

  • RAG — runtime-знания из ваших документов и индексов.
  • MCP — стандартизированные «розетки» для tools и ресурсов.
  • AI-агент — цикл рассуждения и действий в среде.

Три паттерна описывают разные слои одной архитектуры; в зрелом продукте они часто соседствуют. Детали по каждому слою — в связанных статьях выше и в Семи слоях LLM-стека.


См. также

Другие статьи этого же раздела в боковом меню (как на странице "О разделе").