Машинное обучение
Машинное обучение - идея обучения моделей на данных вместо полного ручного задания правил поведения системы.
Scikit-learn — регрессия и классификация
Табличный ML на Python — Pipeline, метрики, LinearRegression, LogisticRegression, RandomForest и GridSearchCV без утечки данных.
Модели обучения
Что такое модель обучения в NLP — архитектуры, токены, эмбеддинги, интенты и словари, параметры, семантический поиск; обзор LSTM, Navec, FastText, BERT, MPNet и LaBSE.
Алгоритмы ИИ
> Справочник по алгоритмам (~40 разделов). Базовые понятия ML, метрики и практика — в статье Машинное обучение.
Как начать с машинного обучения на Python без глубоких знаний математики
Старт ML на Python — Kaggle Learn, маршрут по разделу, Titanic и Melbourne Housing без тяжёлой математики.
Обучение на базе готовой модели
Transfer learning, fine-tuning, multitask и federated learning — чем отличаются подходы, куда идут градиенты и когда что выбирать.
Кодирование категориальных признаков
Семь базовых техник преобразования категорий (цвет, размер, тип) в числа для моделей ML — one-hot, dummy, effect, label, ordinal, count и binary encoding.
Категории обучения и стек инструментов
Четыре категории ML — supervised, unsupervised, semi-supervised и reinforcement; Q-обучение; три «отделения» инструментария — данные, инфраструктура, алгоритмы.
Разбиение данных и кросс-валидация
Train, validation и test — пропорции 70/30, shuffle, stratify, k-fold, утечка данных и когда нужна validation-выборка.
Сквозной проект — цены на жильё в Мельбурне
End-to-end pipeline — Melbourne Housing, очистка в pandas, GradientBoostingRegressor, MAE и GridSearchCV.
Смещение, дисперсия и переобучение
Bias–variance tradeoff, недо- и переобучение, гиперпараметры как «ручки» модели и связь с MAE на train/test.
Деревья решений с нуля
Как строится дерево — энтропия, information gain, переобучение, бэггинг, random forest и градиентный бустинг для новичков.
Машинное обучение — итоги
Краткие итоги раздела "Машинное обучение" — категории обучения, признаки, split, метрики, Melbourne, деревья и scikit-learn.
Машинное обучение — чек-лист
Чек-лист раздела «Машинное обучение» — вопросы для самопроверки.
Машинное обучение — о разделе
Подборка материалов раздела Машинное обучение в энциклопедии Вселенная IT.