О разделе
Здесь — вход в тему баз данных и СУБД — что хранится, как описывается схема, чем реляционная модель отличается от NoSQL и когда нужны оба подхода.
Массовая загрузка, чанки, транзакции на импорт и отличие bulk от OLTP — Пакетная работа с данными.
Рекомендуемый маршрут
Базовый путь (теория + практика в компании):
- Знакомство с базами данных — определения БД и схемы, модель данных vs схема, relation / relationship, четыре основных типа БД (реляционные, NoSQL, иерархические, объектно-ориентированные), обзор SQL / NoSQL / NewSQL.
- СУБД в экосистеме — продукты, клиент–сервер, процессы и память (например PostgreSQL), где что применяют.
- Роль базы данных в организации — зачем центральная БД, жизненный цикл модели, выбор СУБД, люди и процессы.
- Как СУБД выполняет запрос — путь SQL, когда нужна оптимизация, пять шагов формулировки запроса; буферы, пять структур индексов, типы по роли, партиции, план. Конспект для масштабирования — опорные темы. Эксплуатация — управление РСУБД.
- Теоретические основы реляционных данных — Кодд, страницы, WAL, алгебра.
- Двенадцать правил Кодда — критерии "настоящей" реляционной СУБД.
- Entity Relationship — сущности, ключи, кардинальность 1:1 / 1:N / M:N, расширенная EER (супертипы, подтипы), DDL-примеры; теория ключей и JOIN — Реляционная модель.
- Конкурентный доступ — блокировки, MVCC, оптимистичный контроль.
- Восстановление после сбоя — WAL, redo/undo; отличие от бэкапа DBA.
- Итоги и чек-лист.
Проектирование схем (углубление): после пунктов 1 и 7 — Проектирование баз данных (концептуальная / логическая / физическая модель, нормализация, чек-лист перед CREATE TABLE).
Нормализация (1НФ–4НФ, НФБК) подробно в разделе SQL: Нормализация — после Entity Relationship и Реляционная модель данных. Краткий чек-лист моделирования — в той же главе.
Файлы и СУБД, нотации ER: ERD среди нотаций моделирования, расширенная EER (супертипы и подтипы), СУБД — файловое хранение и ограничения, Entity Relationship — нотации.
SQL, транзакции, администрирование: раздел SQL и Управление РСУБД (в т.ч. администрирование в облаке). Практика запросов на схеме магазина с разбором — SQL — реальные кейсы.
Практика по популярным СУБД из кода: SQLite, PostgreSQL, MySQL, Microsoft SQL Server.
Корпоративный контекст: Data Governance.
Масштабирование и system design: опорные темы (B⁺, LSM, WAL, 2PC, реплики, шардинг, CDC) → репликация и шардинг в управлении РСУБД → System Design — карта.
Мини-глоссарий
| Термин | Коротко |
|---|---|
| БД | Совокупность данных + схема (метаданные, ограничения); обрабатывается в ЭВМ. |
| СУБД | Программно-лингвистический комплекс: DDL/DML, буферы, журнал, транзакции, права. |
| Схема БД | Описание содержания, структуры и целостности; в каталоге СУБД (словарь данных). |
| Схема (концептуальная / логическая / физическая) | От ER-идей до файлов и индексов на диске. |
| Модель данных | Теория (структура + манипуляция + целостность); не путать со схемой одной БД. |
| РМД | Реляционная модель Кодда: отношения, алгебра, декларативные ограничения. |
| Отношение (relation) | Множество кортежей с заголовком атрибутов; "реляционная" — от этого слова. |
| Кортеж | Одна строка отношения; порядок кортежей в теории не задан. |
| Потенциальный ключ | Минимальный набор атрибутов, однозначно идентифицирующий кортеж. |
| relationship | Связь на ER-диаграмме; в SQL — FK и JOIN. |
| Внешний ключ (FK) | Подмножество атрибутов дочернего отношения, ссылающееся на ключ родителя. |
| Целостность | Данные удовлетворяют объявленным правилам; истинность фактов СУБД не проверяет. |
| Согласованность данных | Непротиворечивость значений друг с другом; в БД — через ограничения и транзакции. |
| RPO / RTO | Допустимая потеря данных и время восстановления сервиса; задают политику бэкапов. |
| Бэкап / PITR | Копия отдельно от оригинала; откат на момент времени — бэкап + архив WAL. |
| Иерархическая / сетевая модель | Дерево (один родитель) и граф записей (несколько родителей); эпоха до SQL. |
| schema в PostgreSQL | Имя пространства имён (CREATE SCHEMA) — отдельно от "схемы данных" в общем смысле. |
| postmaster | Главный процесс серверной СУБД PostgreSQL: принимает подключения, порождает backend'ы. |
| backend-процесс | Процесс на одну клиентскую сессию; выполняет SQL этой сессии. |
| WAL | Журнал опережающей записи; изменения сначала в журнале, затем в файлах таблиц. |
| Шардинг | Данные одной логической БД на нескольких серверах по ключу шарда; отличие от партиций одной СУБД — §10 в "Как СУБД выполняет запрос". |
Знакомство с базами данных
База данных и СУБД: определения по ГОСТ, схема и модель данных, четыре типа БД (SQL, NoSQL, иерархические, ОО), relation и relationship.
Entity Relationship
ER и расширенная EER-модель — сущности, связи, супертипы и подтипы, кардинальность, ассоциативные сущности и переход к SQL.
Управление данными - Data Governance
Data governance - роли, правила и процессы, чтобы данные были учтены, защищены и использовались согласованно в организации.
Масштабирование БД — опорные темы
B+ и LSM, WAL, репликация, шардинг, 2PC/3PC, индексы, CDC и event store — карта тем для глубокого понимания масштабируемых баз данных.
Системы управления базами данных (СУБД)
Совокупность программных и лингвистических средств, обеспечивающих управление созданием и использованием баз данных.
Внутреннее устройство баз данных
База данных - это ящик с данными, который лежит в архиве - хранилище.
Теоретические основы реляционных данных
СУБД как программный комплекс - хранение, извлечение и изменение данных с гарантиями целостности и безопасности в реляционной модели.
Двенадцать правил Кодда
Критерии "настоящей" реляционной СУБД по Эдгару Кодду — что означает каждое правило и насколько современный SQL им соответствует.
Роль базы данных в организации
Зачем компании централизуют данные, жизненный цикл модели от требований до эксплуатации, роли людей и человеческий фактор в среде БД.
Конкурентный доступ к данным
Параллельные транзакции — блокировки, MVCC, упорядочение по меткам времени и оптимистичный контроль; когда какой подход выбирать.
Восстановление после сбоя
WAL, контрольные точки, redo и undo — как СУБД переживает обрыв питания и чем это отличается от резервного копирования администратора.
Основы баз данных — итоги
Итоги раздела «Основы баз данных» — FAQ и краткие ответы по теме.
Основы баз данных — чек-лист
Чек-лист раздела «Основы баз данных» — вопросы для самопроверки.
Основы баз данных — о разделе
Подборка материалов раздела Основы баз данных в энциклопедии Вселенная IT
В подборках
Статья входит в тематические подборки и блок "С чего начать?" на главной. Соседние шаги того же маршрута:
Базы данных — Структуры данных — о разделе, SQL — о разделе, Базовые операции с данными — о разделе, NoSQL — о разделе, Данные и информация — о разделе, Управление реляционными СУБД — о разделе.
Аналитика данных — Структуры данных — о разделе, SQL — о разделе, Данные и информация — о разделе, NoSQL — о разделе, Продвинутые операции с данными — о разделе, Анализ данных — о разделе.