Перейти к основному содержимому

Чек-лист самопроверки

Разработчику Аналитику Тестировщику
Архитектору Инженеру

Чек-лист самопроверки

  1. Могу ли я чётко сформулировать цель аналитического проекта в терминах бизнеса?
  2. Понимаю ли я разницу между операционными (OLTP) и аналитическими (OLAP) данными?
  3. Умею ли я определить, какие источники данных релевантны для поставленной задачи?
  4. Знаю ли я, как оценить качество данных: полноту, согласованность, актуальность?
  5. Могу ли я выполнить очистку данных: обработать пропуски, удалить дубликаты, исправить выбросы?
  6. Понимаю ли я принципы нормализации и денормализации данных?
  7. Умею ли я строить схемы «звезда» и «снежинка» для хранилищ данных?
  8. Знаю ли я, когда использовать data lake, а когда — data warehouse?
  9. Могу ли я объяснить разницу между ETL и ELT?
  10. Понимаю ли я, как работает жизненный цикл аналитического проекта (например, CRISP-DM)?
  11. Умею ли я проводить исследовательский анализ данных (EDA)?
  12. Знаю ли я основные статистические показатели: среднее, медиана, мода, дисперсия, квартили?
  13. Могу ли я визуализировать распределение данных: гистограммы, box-plot, Q-Q plot?
  14. Умею ли я выявлять и интерпретировать корреляции между переменными?
  15. Понимаю ли я разницу между корреляцией и причинно-следственной связью?
  16. Знаю ли я, как проверить гипотезу с помощью статистических тестов?
  17. Могу ли я построить и интерпретировать сводную таблицу (pivot table)?
  18. Умею ли я работать с временными рядами: выделять тренд, сезонность, остаток?
  19. Понимаю ли я, что такое стационарность временного ряда и как её проверить?
  20. Знаю ли я основные задачи машинного обучения: классификация, регрессия, кластеризация?
  21. Могу ли я выбрать подходящий алгоритм для конкретной задачи?
  22. Умею ли я оценивать качество модели: accuracy, precision, recall, F1, AUC-ROC?
  23. Понимаю ли я, что такое переобучение и недообучение модели?
  24. Знаю ли я методы борьбы с переобучением: регуляризация, кросс-валидация?
  25. Могу ли я объяснить, как работает кросс-валидация?
  26. Умею ли я интерпретировать важность признаков (feature importance) в модели?
  27. Понимаю ли я, что такое data drift и concept drift?
  28. Знаю ли я, как мониторить качество модели в production?
  29. Могу ли я построить многомерный куб (OLAP cube)?
  30. Умею ли я писать выражения на языке DAX?
  31. Понимаю ли я разницу между мерой и вычисляемым столбцом в Power BI?
  32. Знаю ли я, как работает контекст фильтрации в DAX?
  33. Могу ли я создать семантическую модель данных для self-service аналитики?
  34. Умею ли я проектировать интерактивные дашборды с учётом принципов визуальной грамотности?
  35. Понимаю ли я, как избежать визуальных искажений на графиках?
  36. Знаю ли я основные типы ассоциативных правил и как их оценивать (support, confidence, lift)?
  37. Могу ли я применить алгоритм кластеризации и оценить качество разбиения?
  38. Умею ли я обнаруживать аномалии в данных с помощью статистических и ML-методов?
  39. Понимаю ли я, как работает анализ последовательностей (sequence mining)?
  40. Знаю ли я различия между Web Content, Web Structure и Web Usage Mining?
  41. Могу ли я спроектировать пайплайн для автоматизированного анализа?
  42. Умею ли я документировать аналитический процесс: гипотезы, методы, ограничения?
  43. Понимаю ли я этические риски при работе с персональными и биометрическими данными?
  44. Знаю ли я требования законодательства (ФЗ-152, GDPR) к обработке персональных данных?
  45. Могу ли я применить методы анонимизации: k-anonymity, дифференциальная приватность?
  46. Умею ли я различать легальный и нелегальный дата-майнинг?
  47. Понимаю ли я когнитивные искажения, которые могут исказить выводы (overfitting, survivorship bias)?
  48. Знаю ли я, как проверить, не является ли найденная закономерность случайной (multiple testing correction)?
  49. Могу ли я объяснить результаты анализа нетехнической аудитории?
  50. Готов ли я признать, что данные не всегда дают однозначный ответ, и что требуется смирение перед неопределённостью?
Освоение главы0%