Вероятность и статистика
В IT данные шумные, нагрузка непредсказуема, пользователи ведут себя по-разному. Теория вероятностей даёт язык для описания такой неопределённости; статистика — инструменты выводов по выборкам.
События и вероятность
Событие — исход, который может произойти или нет. Вероятность P(A) ∈ [0, 1]:
- 0 — невозможно;
- 1 — достоверно.
Аксиомы Колмогорова задают строгую основу (пространство исходов, σ-алгебра, аддитивность).
| Тип события | Пример |
|---|---|
| Элементарное | «на кубике выпало 4» |
| Сложное | «выпало чётное» |
| Достоверное | результат — одно из чисел 1…6 на кубике |
Две интерпретации
| Подход | Смысл | В IT |
|---|---|---|
| Частотный | предел доли успехов при многих повторах | доля ошибок в логах, success rate API |
| Байесовский | степень уверенности с учётом опыта | диагностика инцидентов, обновление гипотез по новым данным |
Оба допустимы; выбор зависит от задачи: повторяемый эксперимент vs уникальное событие.
Условная вероятность и независимость
Условная: P(A | B) — вероятность A при условии, что B уже произошло. Цепное правило связывает совместные события.
Независимость: P(A | B) = P(A) — знание B не меняет вероятность A. В коде часто предполагают независимость запросов или хешей — это нужно проверять: скрытые корреляции дают трудные баги (кэш, пулы соединений, DDOS-подобные всплески).
Закон больших чисел
При росте числа наблюдений среднее результатов стремится к математическому ожиданию. Обоснование:
- доверять метрикам SLA только на достаточной выборке;
- не делать выводы по одному-двум инцидентам;
- строить доверительные интервалы в A/B-тестах.
Статистика в практике
- Описательная: среднее, медиана, перцентили (p95, p99 латентности).
- Проверка гипотез: отличима ли новая версия от старой не случайно?
- Регрессия и ML: оценка параметров, переобучение, кросс-валидация — надстройка над вероятностными моделями.
Связь с моделированием (Монте-Карло) и теорией информации (энтропия).
См. также
Другие статьи этого же раздела в боковом меню (как на странице «О разделе»). Имя переменной, метода или класса — это когнитивный маячок, который активирует соответствующие схемы в долговременной памяти. История термина «ментальная модель» - Крейк о внутренних представлениях мира, которые строит когнитивная система. Единый процесс - согласованные по цели, времени и пространству действия участников ради одного результата. Что такое система и её элементы, как все это связано и зачем нужно. Краткое знакомство с науками, которые лежат в основе логики программ, данных и вычислений — от булевой алгебры до теории информации. Булева и предикатная логика для разработки — операции, таблицы истинности, кванторы и законы де Моргана в условиях кода. Множества, отношения, графы и комбинаторика — язык описания структур данных, сетей, зависимостей и оценки сложности в IT. Делимость и НОД, запись алгоритмов псевдокодом, худший случай и асимптотика O(n) — связь с криптографией и проектированием кода. Векторы, матрицы, скалярное произведение и системы линейных уравнений — основа ML, графики и численных методов. Математические, имитационные и логические модели — от постановки задачи до валидации и рекомендаций для IT-инфраструктуры. Приближённое решение уравнений, интерполяция и метод наименьших квадратов — когда точная формула недоступна или слишком дорога. Иерархия Хомского, конечные автоматы, грамматики и неразрешимость — основа парсеров, regex и границ статического анализа.Когнитивистика - наука о мышлении
Ментальные модели
Тектология
Системы и модели
Математическая основа IT
Логика
Дискретная математика
Теория чисел, псевдокод и анализ алгоритмов
Линейная алгебра
Моделирование систем
Численные методы
Формальные языки и автоматы