Перейти к основному содержимому

Генеративный искусственный интеллект

Всем

Генеративный ИИ — класс моделей, которые создают новые артефакты (текст, изображение, код, аудио) по запросу, а не только присваивают метку классу. ChatGPT, Copilot, Midjourney, GitHub Copilot — сервисы поверх таких моделей. Базовые определения ИИ и ML — в введении в раздел; здесь — устройство и ограничения генеративного стека.


Чем генеративный ИИ отличается от «классического» ML

АспектКлассический ML (часто)Генеративный ИИ (LLM и др.)
ВыходКласс, число, ранжированиеТекст, картинка, фрагмент кода
ОбучениеПризнаки → меткаПредсказание следующего токена / диффузия пикселей
ОшибкиСмещение метрик«Галлюцинации» — правдоподобный, но неверный текст
Данные на входеТаблица, логиПромпт + опционально RAG-контекст

Модель не «знает факты» как база данных: она воспроизводит статистические паттерны из обучающего корпуса. Поэтому для юридических, медицинских и финансовых решений нужны проверка человеком и ссылки на источники.


LLM - минимальная механика

Большая языковая модель (LLM) получает последовательность токенов (кусочков текста) и на каждом шаге выдаёт распределение вероятностей над следующим токеном. Декодирование (жадное, beam search, sampling с temperature) определяет «креативность» ответа.

Ключевые термины:

  • Контекстное окно — сколько токенов модель «видит» за раз; длинные документы режут или суммаризируют.
  • Системный промпт — инструкция роли («ты помощник поддержки…»), задаётся разработчиком сервиса.
  • Temperature — выше → разнообразнее и рискованнее; ниже → стабильнее и суше.

Инференс LLM требует GPU или специализированных чипов; обучение с нуля доступно единицам организаций — большинство команд дообучают или подключают готовые API.


RAG - когда одной модели мало

Retrieval-Augmented Generation (RAG) — схема «сначала найти релевантные фрагменты в вашей базе, потом подставить их в промпт». Так снижают выдумывание фактов о внутренних документах (регламенты, API, тикеты).

Этапы RAG:

  1. Индексация документов (chunking, эмбеддинги).
  2. Поиск по запросу пользователя (векторный + иногда полнотекстовый).
  3. Сборка промпта: вопрос + найденные цитаты.
  4. Ответ LLM с требованием опираться на цитаты.

RAG не отменяет ошибки: плохой chunking или устаревшая база дают неверный контекст так же надёжно, как галлюцинация.


Агенты (кратко)

Агент — LLM + цикл «план → вызов инструмента → наблюдение». Инструменты: поиск, SQL, HTTP API, выполнение кода в песочнице. Подробнее — Агенты ИИ.


Риски и ответственное использование

  • Конфиденциальность — не вставляйте в публичный чат персональные данные и секреты компании без политики DLP.
  • Авторство и лицензии — сгенерированный код может повторять чужие фрагменты; нужен review.
  • Зависимость от вендора — модели и цены меняются; закладывайте абстракцию API.

Развёрнуто — в ответственном использовании ИИ и ИИ для топ-менеджмента и корпоративного ПО.


Практика на Microsoft Learn

После этой главы:

  1. Концепции ИИ (~40 мин)
  2. Генеративный ИИ и агенты — введение (~37 мин)

Агент с доступом к терминалу выполняет команды от вашего имени — перед запуском сверяйтесь с Опасными скриптами. Архитектура — 6.04 / Агенты ИИ.

Все ссылки — в навигаторе Learn.


Итоги

Генеративный ИИ — статистическая генерация контента, а не разум. LLM + RAG + агенты — инженерные паттерны продакшена 2020-х. Теория здесь, hands-on — на Learn и в ваших pet-проектах с API.


См. также

Другие статьи этого же раздела в боковом меню (как на странице «О разделе»).