Трансформеры и NLP — чек-лист

НЕ ОБЯЗАТЕЛЬНОДЛЯ НОВИЧКОВ

Инженеру

Загрузка вопросов…

Чек-лист самопроверки

Чем обработка естественного языка (NLP) отличается от табличного машинного обучения на входе модели?
Назовите пять типичных задач NLP и формат их входа/выхода.
Что такое токенизация на уровне subword и зачем она нужна?
Какие метрики используют для классификации текста и для machine translation?
В чём ограничения RNN/LSTM по сравнению с трансформером?
Запишите формулу scaled dot-product attention и поясните роль sqrt(d_k).
Чем self-attention отличается от cross-attention?
Зачем трансформеру positional encoding?
Чем encoder-only архитектура отличается от decoder-only и encoder-decoder?
Что такое causal mask и где она применяется?
Из каких подблоков состоит один layer трансформера?
Зачем residual connections и LayerNorm в блоке?
Как устроен multi-head attention концептуально?
Какие компоненты вы реализовали бы в минимальном encoder block на PyTorch?
Чем pre-training отличается от fine-tuning в NLP?
Когда уместен full fine-tuning, а когда LoRA или freeze backbone?
Какую "голову" добавляют к BERT для NER и для классификации документа?
Чем BERT и GPT отличаются по objective и направлению контекста?
Для каких задач логичнее T5 или BART, чем GPT?
Что такое DistilBERT и зачем дистилляция?
Почему стандартный attention плохо масштабируется на очень длинные документы?
Назовите три русскоязычных или multilingual чекпоинта с Hub и их назначение.
Что делает Hugging Face pipeline и когда вызывают модель напрямую?
Зачем sentence-transformers в semantic search и RAG?
Какие шаги чек-листа нужны перед выводом NLP-модели в production?
Какую роль сыграли GLUE и SuperGLUE в 2018–2020?
Что показал GPT-3 про in-context learning и масштаб?
Чем ViT представляет изображение для трансформера?
Как Whisper кодирует аудио перед decoder?
Как CLIP связывает изображения и текст без классификатора на фиксированных классах?

Итоги раздела — Трансформеры и NLP — итоги.

Трансформеры и NLP — чек-лист

Чек-лист самопроверки

См. также

NLP и работа с текстом

Что такое трансформер — архитектура и особенности

Устройство трансформеров — теория и практика с нуля

Дообучение моделей на конкретные задачи NLP

Обзор и разбор трансформерных архитектур

Практика работы с предобученными моделями

Современные тренды в NLP (2018–2021)

Трансформеры в разных модальностях — текст, зрение, звук

Трансформеры и NLP — итоги

Чек-лист самопроверки​

См. также

NLNLP и работа с текстом

NLЧто такое трансформер — архитектура и особенности

NLУстройство трансформеров — теория и практика с нуля

NLДообучение моделей на конкретные задачи NLP

NLОбзор и разбор трансформерных архитектур

NLПрактика работы с предобученными моделями

NLСовременные тренды в NLP (2018–2021)

NLТрансформеры в разных модальностях — текст, зрение, звук

NLТрансформеры и NLP — итоги

Чек-лист самопроверки

NLP и работа с текстом

Что такое трансформер — архитектура и особенности

Устройство трансформеров — теория и практика с нуля

Дообучение моделей на конкретные задачи NLP

Обзор и разбор трансформерных архитектур

Практика работы с предобученными моделями

Современные тренды в NLP (2018–2021)

Трансформеры в разных модальностях — текст, зрение, звук

Трансформеры и NLP — итоги