Перейти к основному содержимому

Трансформеры и NLP — чек-лист

Инженеру
Загрузка вопросов…

Чек-лист самопроверки

  1. Чем обработка естественного языка (NLP) отличается от табличного машинного обучения на входе модели?
  2. Назовите пять типичных задач NLP и формат их входа/выхода.
  3. Что такое токенизация на уровне subword и зачем она нужна?
  4. Какие метрики используют для классификации текста и для machine translation?
  5. В чём ограничения RNN/LSTM по сравнению с трансформером?
  6. Запишите формулу scaled dot-product attention и поясните роль sqrt(d_k).
  7. Чем self-attention отличается от cross-attention?
  8. Зачем трансформеру positional encoding?
  9. Чем encoder-only архитектура отличается от decoder-only и encoder-decoder?
  10. Что такое causal mask и где она применяется?
  11. Из каких подблоков состоит один layer трансформера?
  12. Зачем residual connections и LayerNorm в блоке?
  13. Как устроен multi-head attention концептуально?
  14. Какие компоненты вы реализовали бы в минимальном encoder block на PyTorch?
  15. Чем pre-training отличается от fine-tuning в NLP?
  16. Когда уместен full fine-tuning, а когда LoRA или freeze backbone?
  17. Какую «голову» добавляют к BERT для NER и для классификации документа?
  18. Чем BERT и GPT отличаются по objective и направлению контекста?
  19. Для каких задач логичнее T5 или BART, чем GPT?
  20. Что такое DistilBERT и зачем дистилляция?
  21. Почему стандартный attention плохо масштабируется на очень длинные документы?
  22. Назовите три русскоязычных или multilingual чекпоинта с Hub и их назначение.
  23. Что делает Hugging Face pipeline и когда вызывают модель напрямую?
  24. Зачем sentence-transformers в semantic search и RAG?
  25. Какие шаги чек-листа нужны перед выводом NLP-модели в production?
  26. Какую роль сыграли GLUE и SuperGLUE в 2018–2020?
  27. Что показал GPT-3 про in-context learning и масштаб?
  28. Чем ViT представляет изображение для трансформера?
  29. Как Whisper кодирует аудио перед decoder?
  30. Как CLIP связывает изображения и текст без классификатора на фиксированных классах?

Итоги раздела — 98.


См. также

Другие статьи этого же раздела в боковом меню (как на странице "О разделе").

Освоение главы0%