О разделе

Длинные листинги (от ~15 строк) вынесены в каталог code.spirzen.ru и подгружаются в статьях через ExternalCodeEmbed — так HTML энциклопедии не раздувается, а код остаётся с подсветкой, вкладками и сериями "шаг 1…N". Короткие фрагменты (одна формула DAX, пара строк pandas, SQL до staging) по-прежнему прямо в markdown. Диаграммы mermaid и интерактив — на месте или в play.spirzen.ru.

Раздел выстроен от общей картины к инструментам и прикладным сценариям. Если вы ещё не уверенно работаете с ПК, файлами и браузером — сначала Основы компьютерной грамотности.

Рекомендуемый порядок для первого прохода:

Старт из Excel — Работа с Microsoft Excel — основы → Excel и Google Sheets — формулы — формулы с разбором → Разведочный анализ данных в Excel — EDA в Excel → Основы статистики — статистика → Маршрут Excel → R → Python — маршрут Excel → R → Python → ветка Python для анализа данных — Python или 5-23-r/103 — R.
Анализ данных — OLTP/OLAP, семантика, DAX, жизненный цикл аналитики.
Data Science — роли, стек и подготовка данных для ML (нормализация, split, аугментация); до Pandas — Python — файлы и CSV (stdlib); NumPy — массивы и матрицы; типовые операции Pandas; примеры pandas с разбором; практикум — Pandas Data Viewer (Tkinter + pandas — загрузка CSV/Excel, поиск, статистика); текст как признаки — TF-IDF; практикум — распознавание цифр на PyTorch (MNIST, CNN, GUI-инференс); практикум — тональность отзывов на PyTorch; SQL — реальные кейсы (groupby, join, суммы — тот же смысл, что в SQL); напоминалка Pandas / Polars / SQL / PySpark / Excel; очистка в Pandas.
Пакетная работа с данными — теория batch, bulk, chunk, транзакции, идемпотентность, разбиение тяжёлых операций (хаб перед ETL и потоком).
Big Data (в т. ч. Data Warehouse, Data Lake и Data Mesh), ETL/ELT, потоковая аналитика — масштаб, конвейеры, события в реальном времени.
Дата-майнинг, причинно-следственный анализ, ошибки интерпретации — закономерности, корреляция и критическое мышление.
Python для анализа (очистка таблиц — Очистка и подготовка данных в Pandas), ИИ в аналитике (промпты — библиотека), Power BI — практика и self-service. Числовые массивы — NumPy — массивы и матрицы — NumPy; текст отчёта с формулами — LaTeX — формулы для отчётов; символьная математика (уравнения, производные) — SymPy — уравнения и производные; графики из Python — Matplotlib — графики.

Углубление по тому же маршруту — Вероятность для аналитика данных — вероятность, Линейная регрессия — Excel, R и Python — регрессия в Excel, R и Python.

Прикладные кейсы: технологии в спорте, умный дом (IoT и телеметрия). Итоги — в Анализ данных — итоги, самопроверка — в Анализ данных — чек-лист.

В подборках

Статья входит в тематические подборки и блок "С чего начать?" на главной. Соседние шаги того же маршрута:

Аналитика данных — Продвинутые операции с данными — о разделе, Python — о разделе, NoSQL — о разделе, R — о разделе, SQL — о разделе, Основы баз данных — о разделе.

О разделе

Анализ данных

Big Data

Data Science

Дата майнинг

Ошибки интерпретации и манипуляции статистикой

Умный дом

Технологии в спорте

Основы статистики

Как использовать ИИ для анализа данных

Причинно-следственный анализ

Потоковая аналитика в реальном времени

Python для анализа данных

ETL-ELT и оркестрация

Табличные данные — Pandas, Polars, SQL и PySpark

Очистка и подготовка данных в Pandas

Pandas — типовые операции при анализе данных

Разведочный анализ данных в Excel

Power BI и self-service аналитика

Маршрут Excel → R → Python

Вероятность для аналитика данных

Линейная регрессия — Excel, R и Python

Пакетная работа с данными

📄️Анализ данных — итоги

📄️Анализ данных — чек-лист

Анализ данных — о разделе

В подборках

Анализ данных

Big Data

Data Science

Дата майнинг

Ошибки интерпретации и манипуляции статистикой

Умный дом

Технологии в спорте

Основы статистики

Как использовать ИИ для анализа данных

Причинно-следственный анализ

Потоковая аналитика в реальном времени

Python для анализа данных

ETL-ELT и оркестрация

Табличные данные — Pandas, Polars, SQL и PySpark

Очистка и подготовка данных в Pandas

Pandas — типовые операции при анализе данных

Разведочный анализ данных в Excel

Power BI и self-service аналитика

Маршрут Excel → R → Python

Вероятность для аналитика данных

Линейная регрессия — Excel, R и Python

Пакетная работа с данными

📄️Анализ данных — итоги

📄️Анализ данных — чек-лист

Анализ данных — о разделе

В подборках​

Связанные темы

В подборках