Перейти к основному содержимому

О разделе

Раздел посвящён обработке естественного языка (NLP) и архитектуре Transformer, которая с 2017 года стала основой современных языковых моделей, систем перевода, классификаторов текста и мультимодальных систем.

Краткое упоминание трансформера есть во введении в ИИ и в статье Большие языковые модели. Здесь — углублённый маршрут: от задач NLP и устройства attention до реализации блоков с нуля, fine-tuning, обзора семейств моделей и практики с Hugging Face, в том числе для русского языка.

Рекомендуемый порядок
  1. NLP и работа с текстом — задачи, корпуса, метрики.
  2. Что такое трансформер — attention, encoder/decoder, особенности.
  3. Трансформер с нуля — теория и минимальная реализация на PyTorch.
  4. Дообучение под задачи NLP — fine-tuning, LoRA, heads.
  5. Обзор архитектур — BERT, GPT, T5, Longformer и др.
  6. Предобученные модели на практике — pipelines, русскоязычные чекпоинты.
  7. Тренды NLP 2018–2021 — эволюция от ELMo до GPT-3.
  8. Мультимодальные трансформеры — ViT, Whisper, CLIP.
  9. Итоги и чек-лист.

Перед разделом полезны нейрон и слои, перцептрон на NumPy и PyTorch для разработчика. После — LLM и ChatGPT и работа с ИИ-моделями.


В подборках

Статья входит в тематические маршруты из меню Подборки и блока «С чего начать?» на главной. Соседние шаги маршрута Нейросети и ИИ:

Машинное обучение — о разделе, Нейросети — о разделе, Модели и инструменты — о разделе, Разработка ИИ — о разделе.


Освоение главы0%