C++ - язык системного программирования

ОБЯЗАТЕЛЬНОДЛЯ НОВИЧКОВНЕ ДЛЯ НОВИЧКОВВ РАЗРАБОТКЕ

Разработчику Архитектору

Основы C++

Добро пожаловать в мир C++

Если вы читаете эту статью, значит вы решили познакомиться с одним из самых влиятельных языков программирования в истории компьютеров. Это отличный выбор!

Название C++ читается как "си плюс плюс". Символ ++ — это оператор постинкремента в C.

Бьёрн Страуструп, разрабатывая язык в Bell Labs в 1979–1985 годах, начал с эксперимента под названием C with Classes — надстройки над C, добавляющей поддержку классов, наследования и конструкторов/деструкторов. Совместимость с C изначально была условием выживания. Нельзя было требовать от инженеров переписывать ядра, драйвера и низкоуровневые библиотеки — следовало позволить им наращивать новую функциональность поверх уже написанного кода. Отсюда и фундаментальная особенность: любая корректная программа на C является корректной программой на C++ (с небольшими оговорками, связанными с ключевыми словами и строгостью проверок). Это совместимость на уровне лексического и синтаксического анализа.

Но если C++ начался как C с классами, то к середине 1990-х он уже вышел далеко за пределы этой идеи. Шаблоны (введённые в 1991 г.), исключения, пространства имён, STL (Standard Template Library, принятая в стандарт в 1998 г.) — всё это не «добавки к C», а самостоятельные парадигмы, вплетённые в язык. Важно понимать: C++ — это не один язык, а набор взаимосовместимых подъязыков, укладываемых в одну систему типов и одну модель компиляции. Программист может писать в стиле чистого процедурного C (что нередко делается в embedded-разработке), использовать объектно-ориентированную модель (как в большинстве фреймворков), применять обобщённое программирование через шаблоны (как в современных библиотеках вроде Eigen или Boost.Hana), или даже встраивать функциональные паттерны (через лямбда-выражения, появившиеся в C++11).

Почему C++ до сих пор актуален, несмотря на «более удобные» языки?

Чтобы ответить на этот вопрос, необходимо отделить удобство разработки от требований к исполнению. Языки вроде C#, Java, Python или Go решают одну ключевую задачу: повысить продуктивность программиста за счёт ограничений, абстракций и автоматизации. Сборка мусора, строгая типизация времени выполнения, управляемая среда — всё это снижает когнитивную нагрузку и уменьшает количество классов ошибок. Но цена за это — предсказуемость производительности.

C++ не гарантирует, что вы напишете код быстрее. Он гарантирует, что если вы знаете, что делаете, то получите максимально близкое к аппаратным возможностям время выполнения. Это достигается за счёт нескольких фундаментальных принципов:

Отсутствие накладных расходов по умолчанию (zero-cost abstractions).
Любая абстракция — будь то шаблонный контейнер std::vector, итератор или умный указатель — должна компилироваться в код, не уступающий по эффективности ручному управлению. Например, std::vector<T>::operator[] сводится к простой арифметике указателей — никаких проверок границ (если не включены отладочные режимы), никаких вызовов виртуальных функций. Это не «оптимизация компилятором», а архитектурное требование: если абстракция не может быть реализована без overhead’а, она либо не вводится, либо предоставляется альтернатива без него.
Прямой контроль над моделью памяти.
C++ не навязывает кучу, стек и статическую память как единственно возможные области. Он предоставляет инструменты для работы с ними — new/delete, malloc/free, размещение объектов на стеке, placement new — и позволяет создавать собственные аллокаторы, менеджеры памяти, пулы. В играх, например, критически важно избегать фрагментации и пауз от сборки мусора; в реальном времени — гарантировать, что выделение памяти не приведёт к блокировке. В C++ это не «возможно», а ожидаемо.
Прозрачность компиляции и линковки.
В отличие от JIT-компилируемых или интерпретируемых языков, C++ превращается в машинный код до запуска. Это позволяет профилировать, оптимизировать, анализировать ассемблерный вывод на этапе разработки. Для высоконагруженных систем (биржевые трейдинговые платформы, телекоммуникационные стеки, ядра ОС) критична скорость и предсказуемость: нельзя допустить, чтобы сборка мусора в Java-приложении внезапно вызвала задержку в 50 мс — на фондовом рынке это эквивалентно потере сделки. C++ позволяет доказать отсутствие таких пауз аналитически.
Платформенная независимость без посредника.
C++ не требует виртуальной машины. Исполняемый файл — это нативный код для целевой архитектуры (x86-64, ARM, RISC-V и др.). Это означает:
- отсутствие зависимости от runtime’а (кроме стандартной библиотеки, которую можно статически линковать);
- минимальный размер образа (в embedded-системах — килобайты);
- возможность прямого доступа к регистрам, портам ввода-вывода, страницам памяти;
- совместимость с legacy-кодом и бинарными интерфейсами (ABI), написанными на C и ассемблере.

Именно эти свойства делают C++ не заменяемым в таких областях, как:

Ядра операционных систем (Windows NT, Linux, macOS XNU — все содержат значительные части на C++);
Графические и игровые движки (Unreal Engine, Frostbite, Source 2 — полностью или частично на C++);
Браузерные движки (Chromium/V8, WebKit — C++ как основа);
СУБД (MySQL, PostgreSQL, MongoDB — движки выполнения запросов);
Системы реального времени и embedded (автомобильные контроллеры, авиаэлектроника, робототехника);
Высокочастотный трейдинг (где каждая наносекунда — деньги).

Да, C# (а также Rust, Zig, Go) успешно конкурируют в смежных нишах — например, в серверной разработке или инструментарии. Но в тех случаях, где требуется абсолютный контроль над выполнением — C++ остаётся единственным промышленно апробированным вариантом с 40-летней историей развития, стабильным ABI и огромной экосистемой (компиляторы, отладчики, профайлеры, статические анализаторы).

Архитектурные основы

Прежде чем говорить о синтаксисе, важно понять модель компиляции — ту «машину», внутри которой живёт C++-код. В отличие от языков с единым загрузчиком (например, JVM), C++ опирается на многоступенчатую, децентрализованную схему:

1. Единица трансляции (translation unit)

Программа на C++ состоит из множества единиц трансляции. Каждая такая единица — это один .cpp-файл после предварительной обработки (#include, #define, условная компиляция). То есть:

// main.cpp
#include <iostream>
#include "utils.h"

int main() { /* ... */ }

после #include превращается в один большой текст, содержащий всё содержимое <iostream>, utils.h и собственного кода. Этот текст и есть единица трансляции.

Ключевая особенность: каждая единица трансляции компилируется независимо. Нет глобального анализа всей программы на этапе компиляции. Это накладывает ограничения (например, невозможность оптимизировать вызовы между единицами без LTO), но даёт гигантский выигрыш в скорости сборки и масштабируемости — в проектах с миллионами строк можно перекомпилировать только изменившиеся .cpp-файлы.

2. Заголовочные файлы

.h- или .hpp-файлы в C++ — это спецификации интерфейсов, передаваемые между единицами трансляции. Они содержат:

объявления функций и классов (не определения);
inline-функции и шаблоны (которые должны быть видны во всех единицах, где используются);
constexpr-константы;
директивы #pragma once или include guards (защита от множественного включения).

Заголовок — это договор: «если ты мне подключишь этот файл, я гарантирую, что в линковке будет найдена реализация этих символов». Нарушение этого договора (например, определение глобальной переменной в заголовке без inline) приводит к ошибкам линковки.

3. Компиляция → Линковка → Выполнение

Этапы:

Предобработка (cpp): раскрытие макросов, включение файлов.
Компиляция (g++ -c main.cpp): превращение единицы трансляции в объектный файл (.o / .obj), содержащий машинный код и таблицу символов (имена функций, глобальных переменных).
Линковка (ld, link.exe): объединение всех объектных файлов и библиотек в исполняемый файл или библиотеку. На этом этапе разрешаются внешние ссылки (например, вызов printf связывается с реализацией из libc).
Запуск: загрузка кода в память, инициализация глобальных объектов (в порядке определения внутри единицы, но неопределённом между ними!), вызов main().

Важно: глобальные объекты инициализируются до main(), и порядок их инициализации между разными единицами трансляции не определён. Это одна из самых тонких и опасных особенностей C++ (т.н. «static initialization order fiasco»).

Синтаксис

Хотя лексика C++ унаследована от C (точки с запятой, фигурные скобки, операторы +, -, *, /), семантика многих конструкций принципиально иная. Рассмотрим ключевые отличия на уровне восприятия кода.

Пространства имён

Пространство имён (namespace) — это лексическая область видимости, вводимая для избежания коллизий имён. В отличие от Java, где иерархия пакетов отражается в файловой структуре и имени класса (com.example.Foo), в C++ пространство имён не влияет на ABI и линковку: std::vector<int> и mylib::vector<int> — это совершенно разные типы, даже если реализации идентичны.

Критически важно: пространства имён можно расширять. В одном заголовке можно написать:

namespace graphics {
    class Point { /* ... */ };
}

а в другом —

namespace graphics {
    class Color { /* ... */ };
}

и оба объявления отнесутся к одному и тому же graphics. Это позволяет разделять интерфейсы по функциональности, не привязываясь к файловой структуре.

Перегрузка операторов

В C++ операторы — это функции-члены или свободные функции с особым именем (operator+, operator<< и т.д.). Это означает:

вы можете определить смысл + для своих типов;
<< и >> для std::ostream/std::istream — это обычные функции, перегруженные в <iostream>;
компилятор разрешает, какую версию оператора вызывать, на основе типов операндов (перегрузка по типам).

Это даёт гибкость, но требует дисциплины: нельзя перегружать операторы так, чтобы нарушалась их «естественная» семантика (например, a + b не должно изменять a).

Классы

Самая важная роль класса в C++ — инкапсуляция ресурсов через RAII (Resource Acquisition Is Initialization). Рассмотрим:

class FileHandle {
    FILE* fp;
public:
    FileHandle(const char* name) : fp(fopen(name, "r")) {}
    ~FileHandle() { if (fp) fclose(fp); }
    // запрещаем копирование по умолчанию
    FileHandle(const FileHandle&) = delete;
    FileHandle& operator=(const FileHandle&) = delete;
};

Здесь деструктор гарантирует освобождение ресурса автоматически, при выходе из области видимости. Это работает независимо от исключений: если в функции, использующей FileHandle, произойдёт throw, деструктор вызовется в процессе раскрутки стека. Именно RAII — основа безопасности C++ в условиях отсутствия сборщика мусора.

Шаблоны

Шаблоны (template) — это механизм метапрограммирования первого класса. При инстанцировании шаблона (например, std::vector<int>) компилятор генерирует новый код — отдельную версию функций и методов для каждого набора параметров. Это позволяет:

добиваться zero-cost abstractions (как в std::vector);
писать обобщённый код без приведения типов;
вычислять значения и типы во время компиляции (через constexpr, if constexpr, template specialization).

Например, std::enable_if или std::conditional — это языковые конструкции, позволяющие ветвить логику компиляции в зависимости от свойств типов.

Стандарты и эволюция

C++ живёт. Стандарт обновляется каждые три года: C++11 (революция), C++14 (уточнения), C++17 (практические улучшения), C++20 (концепции, модули, корутины), C++23 (в работе). Например:

C++11 принёс: auto, range-based for, nullptr, move semantics, лямбды, std::unique_ptr/std::shared_ptr, constexpr;
C++20 добавил: Concepts (ограничения на шаблоны), Modules (альтернатива #include), Coroutines (асинхронность без callback hell), std::span, std::format.

Модули, в частности, решают фундаментальную проблему C: O(N²) зависимостей при #include. Вместо текстового включения заголовков, модули экспортируют интерфейсные декларации, что ускоряет компиляцию в десятки раз и исключает проблемы с include guards.

RAII

Resource Acquisition Is Initialization — это не просто способ избежать утечек памяти. Это модель управления временем жизни любых внешних ресурсов: файлов, сокетов, блокировок, GPU-буферов, транзакций в СУБД. В C++ ресурс считается приобретённым в момент конструирования объекта и освобождённым в момент его уничтожения. Важно: деструктор вызывается детерминированно, при выходе из области видимости — даже если выброшено исключение.

Пример: работа с мьютексом.

void critical_section(std::mutex& m) {
    std::lock_guard<std::mutex> lock(m); // захват мьютекса в конструкторе
    // ... критический код ...
    // деструктор lock автоматически вызовет m.unlock()
}

Здесь невозможно забыть разблокировать мьютекс: если критический код бросит исключение, стек раскрутится, и lock уничтожится до того, как исключение покинет функцию. Это называется exception safety — и оно встроено в язык, а не реализовано надстройками.

Сравните с C:

void critical_section(mutex_t *m) {
    mutex_lock(m);
    // ... если здесь будет ошибка, mutex_unlock() не вызовется ...
    mutex_unlock(m);
}

В C приходится вручную дублировать unlock в каждом goto error, что приводит к ошибкам. В C++ — нет.

RAII лежит в основе всех «умных указателей»:

std::unique_ptr<T> — единоличное владение, move-only, нулевой overhead;
std::shared_ptr<T> — разделяемое владение, счётчик ссылок (не thread-safe по умолчанию — std::make_shared решает это);
std::weak_ptr<T> — наблюдатель, не продлевает жизнь объекта.

Заметьте: никакие из них не являются «заменой сборщику мусора». Они реализуют разные модели владения. unique_ptr часто компилируется в тот же код, что и T* вручную — просто с гарантией вызова delete.

Стандартная библиотека C++

STL (Standard Template Library), принятая в стандарт C++98, — это не просто набор контейнеров (vector, map, set). Это единая система абстракций, включающая:

Контейнеры — структуры данных (vector, deque, list, map, unordered_map, array, span);
Итераторы — обобщённые «указатели», позволяющие отделить алгоритм от структуры данных;
Алгоритмы — функции вроде std::sort, std::find, std::transform, работающие через итераторы;
Функторы и адаптеры — std::less, std::greater, std::bind, std::function.

Ключевой принцип: алгоритмы не знают о контейнерах. std::sort(v.begin(), v.end()) работает одинаково для std::vector<int> и int arr[100] — потому что оба предоставляют рандом-доступные итераторы. Это — истинная сила обобщённого программирования.

Но STL — лишь часть стандартной библиотеки. Современный <iostream>, <filesystem>, <thread>, <chrono>, <regex>, <format> (C++20) — это полноценные фреймворки, спроектированные под те же принципы:

эффективность по умолчанию;
совместимость с RAII;
поддержка пользовательских типов через перегрузку.

Например, std::filesystem::path не хранит строки напрямую — он инкапсулирует логику нормализации, разделителей, кодировок ОС. И при этом:

std::filesystem::path p = "/home/user/file.txt";
std::cout << p.filename() << std::endl; // file.txt

— работает без динамических аллокаций в простых случаях (SSO — Small String Optimization применяется и здесь).

C++ и C#

Сравнение C++ и C# часто сводят к синтаксису: «оба используют фигурные скобки». Но суть — в модели исполнения.

Критерий	C++	C# (.NET)
Модель памяти	Нативная: стек, куча, статическая память — программа управляет всем.	Управляемая: garbage-collected heap, стек для значимых типов, pinned objects для межъязыкового взаимодействия.
Время связывания	Статическое (link-time), частично динамическое (DLL/so).	Загрузка сборок JIT’ом (или AOT в .NET Native / NativeAOT), reflection.
ABI (Application Binary Interface)	Стабилен на уровне компилятора (MSVC, GCC), но не между ними.	Стабилен через IL (Intermediate Language) и CLR — двоичная совместимость между версиями .NET.
Совместимость с C	Полная: можно линковать `.o`-файлы из C напрямую.	Только через P/Invoke или C++/CLI — с overhead’ом и ограничениями.
Предсказуемость latency	Да: можно доказать отсутствие пауз, использовать lock-free структуры, избегать аллокаций.	Нет: GC паузы (даже в режиме low-latency) не гарантированы.
Портативность	Требует перекомпиляции, но работает на любой архитектуре с компилятором.	Требует runtime (CLR/CoreCLR), но IL-код переносится без изменений.

C# — это платформа (язык + библиотеки + runtime), C++ — язык системного проектирования. Выбирая C#, вы вступаете в договор: «я отказываюсь от контроля над памятью и временем выполнения в обмен на безопасность и скорость разработки». Выбирая C++, вы берёте на себя ответственность — но получаете полную власть.

Именно поэтому C++ не «устарел»: он решает другие задачи. Невозможно написать ядро ОС на C#, потому что .NET требует ОС для запуска. Невозможно написать GPU-шейдерный компилятор на C# без огромных прослоек — потому что он должен генерировать код до загрузки runtime’а.

Современный инструментарий

C++ давно перестал быть языком «просто .cpp и g++». Индустрия стандартизировала инструменты:

Сборка

cmake_minimum_required(VERSION 3.20)
project(MyApp LANGUAGES CXX)

set(CMAKE_CXX_STANDARD 20)
set(CMAKE_CXX_STANDARD_REQUIRED ON)

add_executable(myapp main.cpp utils.cpp)
target_link_libraries(myapp PRIVATE Threads::Threads)
target_compile_options(myapp PRIVATE -Wall -Wextra -Wpedantic)

CMake генерирует нативные проекты: Makefile, Ninja, Visual Studio .sln, Xcode — в зависимости от окружения. Он абстрагирует платформенные различия, но не скрывает их.

Управление зависимостями

Conan — централизованный пакетный менеджер (как Maven для C++):
```
[requires]
boost/1.84.0
nlohmann_json/3.11.3

[generators]
CMakeDeps
```
vcpkg — от Microsoft, интегрируется в Visual Studio, поддерживает triplets (x64-windows, arm64-linux и т.д.).

Оба позволяют собирать зависимости из исходников с вашими флагами — критично для embedded и high-performance.

Санитайзеры

AddressSanitizer (ASan) — ловит use-after-free, buffer overflows, double-free;
UndefinedBehaviorSanitizer (UBSan) — переполнение знаковых целых, деление на ноль, выравнивание;
ThreadSanitizer (TSan) — data races;
MemorySanitizer (MSan) — чтение неинициализированной памяти.

Запуск:

g++ -fsanitize=address,undefined -g main.cpp -o app
./app  # при ошибке — стек-трейс с точным местом

Это — обязательный этап в CI/CD профессиональных проектов.

Модули (C++20)

// math.ixx (интерфейсный модуль)
export module math;

export int add(int a, int b) { return a + b; }
export double pi = 3.1415926535;

// main.cpp
import math;

int main() {
    std::cout << add(2, 3) << " and " << pi << "\n";
}

Модули:

устраняют O(N²) зависимостей;
ускоряют компиляцию в 10–100×;
изолируют препроцессорные макросы (они не «просачиваются»);
позволяют экспортировать только интерфейс, скрывая реализацию.

Это — наиболее значимое изменение в экосистеме C++ за 25 лет.

Перспективы

Текущий стандарт — C++23 (принят в 2024 г.), работа над C++26 идёт активно. Ключевые направления:

Исправление исторических ошибок:
- унификация std::span и std::mdspan (многомерные массивы);
- std::expected<T, E> как стандартный способ возврата ошибок (альтернатива исключениям);
- упрощение синтаксиса корутин (C++20 ввёл их, но API неудобен).
Контракты (Contracts):
```
int sqrt(int x) [[expects: x >= 0]] [[ensures r: r * r == x]];
```
Позволят формально специфицировать пред- и постусловия, проверяемые на этапе компиляции или выполнения.
Reflection (метаинформация времени компиляции): Возможность анализировать структуру классов, членов, атрибутов — без макросов и boilerplate’а. Это откроет путь к автоматической сериализации, binding’ам, генерации интерфейсов.
Безопасность памяти без overhead’а: Исследования в рамках C++ Safety Profiles (например, от Microsoft и Google) — как запретить «опасные» практики (сырые указатели, reinterpret_cast) на уровне статического анализа, не теряя производительности.

Единица трансляции

Как уже упоминалось, C++ компилируется по единицам трансляции (translation units), каждая из которых — это результат обработки одного .cpp-файла препроцессором. Однако важно понимать, что именно изолируется и что приводит к связыванию.

Каждая единица трансляции — это **автономный контекст для:

разрешения имён (через using, namespace, ADL — Argument-Dependent Lookup);
инстанцирования шаблонов (при этом одно и то же шаблонное определение может быть инстанциировано по-разному в разных единицах, если параметры шаблона зависят от локальных typedef или using);
инициализации статических объектов (глобальных и static в пространствах имён).

Последнее особенно важно: порядок инициализации одноимённых статических объектов в разных единицах не определён. Это — главная причина «static initialization order fiasco», которую невозможно исключить полностью, но можно смягчить:

// utils.cpp
const std::string& get_config_path() {
    static const std::string path = load_config_path(); // локальный static — инициализация при первом вызове
    return path;
}

Здесь path инициализируется лениво и ровно один раз — даже в многопоточной среде (гарантия C++11+).

Совместимость с C

C++ сохраняет двустороннюю совместимость с C на уровне объектного кода. Это достигается через механизм языковой связи (language linkage):

// В C++ заголовке, предназначенном для C-кода:
#ifdef __cplusplus
extern "C" {
#endif

int legacy_c_function(int x);
void* allocate_buffer(size_t n);

#ifdef __cplusplus
}
#endif

Ключевое:

extern "C" подавляет манглинг имён — компилятор генерирует символы вида _legacy_c_function, а не _Z18legacy_c_functioni;
функции, объявленные в extern "C", не могут быть перегружены и не могут быть членами классов;
можно включать C-заголовки внутрь extern "C" блоков — это стандартная практика в смешанных проектах.

Это позволяет:

использовать C-библиотеки (POSIX, OpenGL, zlib, SQLite) напрямую;
писать интерфейсы для других языков (Python через ctypes, Rust через extern "C"), поскольку C — де-факто ABI-интерфейс для межъязыкового взаимодействия;
сохранять стабильность двоичного интерфейса: изменение реализации на C++ не ломает существующие .so/.dll, если заголовки не менялись.

⚠️ Важно: extern "C" не означает, что функция будет выполняться как C-код — она компилируется тем же компилятором, но с другим соглашением о вызовах и именовании.

Мономорфизация, code bloat и концепты

В отличие от generics в C# или Java, шаблоны C++ — это генерация кода на этапе компиляции (мономорфизация). При каждом уникальном наборе аргументов шаблона компилятор создаёт отдельную копию функции или класса.

Пример:

template<typename T>
T add(T a, T b) { return a + b; }

int main() {
    add<int>(1, 2);        // генерируется add<int>
    add<double>(1.0, 2.0); // генерируется add<double>
}

Компилятор выдаст два независимых символа: _Z3addIiET_S0_S0_ и _Z3addIdET_S0_S0_ — с разным машинным кодом, оптимизированным под int и double.

Преимущества:

add<int> компилируется в lea eax, [rdi + rsi] — без вызовов, без проверок;
std::vector<bool> может иметь специализацию, хранящую биты, в то время как std::vector<int> — 32-битные слова;

if constexpr (C++17) позволяет условно исключать код из инстанцирования:

template<typename T>
auto process(T x) {
    if constexpr (std::is_integral_v<T>) {
        return x * 2;
    } else {
        return x.length();
    }
}

Недостатки:

Code bloat: если шаблон используется с 100 типами — 100 копий кода;
сложные сообщения об ошибках (до C++20 — «template instantiation depth exceeds»);
невозможность отделить интерфейс от реализации (шаблон должен быть виден целиком в заголовке).

Концепты (C++20)

Концепты — это ограничения на параметры шаблонов на уровне компиляции, позволяющие:

писать понятные условия: template<std::integral T> T add(T a, T b);
получать осмысленные ошибки: «std::string не удовлетворяет концепту std::integral» вместо «оператор + не определён для basic_string»;

перегружать шаблоны по концептам:

template<std::integral T>
void sort(T* arr, size_t n); // быстрая сортировка для POD

template<std::sortable U>
void sort(std::vector<U>& v); // интроспективная сортировка для контейнеров

Это — переход от duck typing («если крякает, как утка») к structural typing («если имеет операции <, =, swap — то Sortable»).

Исключения

Распространённое утверждение: «исключения в C++ бесплатны, если не выбрасываются». На практике — это table-driven zero-cost exception handling.

Как это работает (вкратце):

При компиляции генерируются таблицы раскрутки стека (LSDA — Language-Specific Data Area), описывающие, какие деструкторы вызывать при раскрутке для каждой точки программы.
При выбросе исключения (throw) runtime ищет в этих таблицах соответствие типа исключения и блока catch.
Если найдено — стек раскручивается, вызываются деструкторы, управление передаётся в catch.
Если не найдено — вызывается std::terminate.

Накладные расходы:

✅ В нормальном потоке: ни одного дополнительного if, ни одного сравнения — ноль overhead’а.
❌ При выбросе: поиск в таблицах O(1) в среднем, но с затратами на обход фреймов стека и вызов деструкторов.
❌ Размер кода: таблицы увеличивают размер бинарника (на 5–15%, в зависимости от объёма try/catch).

Поэтому в real-time системах (авионика, embedded) исключения часто отключаются (-fno-exceptions), а ошибки передаются через std::expected<T, E> (C++23) или коды возврата.

Философия «pay for what you use»

Этот принцип — основа стандартизации C++. Он означает:

Если вы не используете некую функцию языка или библиотеки, она не должна:

увеличивать размер исполняемого файла;

замедлять выполнение;

усложнять модель памяти;

вводить неопределённое поведение.

Примеры:

Фича	Как обеспечивается «pay for what you use»
Виртуальные функции	Таблица виртуальных функций (`vtable`) создаётся только если в классе есть хотя бы одна `virtual` функция. Чистые данные (`struct Point { int x, y; }`) — без overhead’а.
RTTI (`typeid`, `dynamic_cast`)	Активируется только при использовании; без `-frtti` — исключается из бинарника полностью.
Исключения	При `-fno-exceptions` компилятор удаляет LSDA и заменяет `throw` на `abort()`.
`std::vector`	Нет виртуальных вызовов, нет проверок границ в `operator[]`, аллокатор можно заменить.
`std::function`	Использует малый буфер (SSO) для лямбд без захвата — без аллокаций.

Это — не «оптимизация компилятором». Это — спецификационное требование. Например, стандарт гарантирует, что std::unique_ptr<T> имеет тот же размер, что и T*, и что его move — тривиален.

Header Units и Modules

До C++20 единственный способ компоновки — #include, что приводит к:

O(N²) зависимостей: каждый #include <vector> тянет за собой <type_traits>, <memory>, <initializer_list> и т.д.;
Дублирование парсинга: один и тот же <iostream> парсится в каждом .cpp, где он нужен;
Макросные конфликты: #define max(a,b) ((a)>(b)?(a):(b)) в Windows’овском windows.h ломает std::max.

Header Units (C++20) — промежуточное решение:

g++ -fmodules-ts -xc++-system-header iostream

Превращает <iostream> в бинарный модуль, который компилируется один раз и импортируется быстро.

Именованные модули — окончательное:

// math.mpp
export module math;
export import <cmath>;

export double deg2rad(double deg) { return deg * std::numbers::pi / 180.0; }

// main.cpp
import math;
import <iostream>;

int main() {
    std::cout << deg2rad(180.0) << "\n"; // 3.14159...
}

Преимущества:

компиляция ускоряется в 10–100×;
макросы не «просачиваются»;
интерфейс (export) явно отделён от реализации;
IDE получает точную информацию без парсинга тысяч строк.

Модель памяти и многопоточность

С появлением C++11 стандарт впервые зафиксировал модель памяти, совместимую с аппаратными архитектурами (x86, ARM, POWER). До этого поведение многопоточных программ зависело от компилятора и CPU — и было неопределённым.

Ключевое понятие — happens-before («происходит до»). Это частичный порядок на операциях в программе, который гарантирует, что эффекты одной операции будут видны в другой. В C++ он строится из трёх компонентов:

Program order — порядок в рамках одного потока;
Synchronizes-with — связи через синхронизирующие операции (например, mutex.lock() → mutex.unlock() в другом потоке);
Transitive closure — если A happens-before B и B happens-before C, то A happens-before C.

Пример: data race и его устранение

// НЕПРАВИЛЬНО: data race
int counter = 0;
std::thread t1([]{ for (int i = 0; i < 1000; ++i) ++counter; });
std::thread t2([]{ for (int i = 0; i < 1000; ++i) ++counter; });
t1.join(); t2.join();
// counter может быть < 2000 — неопределённое поведение!

Решение — синхронизация:

std::mutex mtx;
int counter = 0;

auto inc = [&]{
    for (int i = 0; i < 1000; ++i) {
        std::lock_guard lock(mtx);
        ++counter;
    }
};

Здесь lock() в одном потоке synchronizes-with unlock() в другом, и ++counter внутри критической секции упорядочено.

Атомарные операции

std::atomic<int> counter{0};

// без блокировок, но с гарантией целостности
counter.fetch_add(1, std::memory_order_relaxed); // если порядок не важен

Модификаторы memory_order позволяют выбрать компромисс:

relaxed — только атомарность, без упорядочения (счётчики);
acquire/release — однонаправленный барьер (например, «публикация» указателя);
seq_cst — полная последовательная согласованность (по умолчанию, но дорого на ARM).

Пример «публикации» данных:

struct Data { int x, y; };
Data data;
std::atomic<bool> ready{false};

// Поток-производитель:
data.x = 42;
data.y = 73;
ready.store(true, std::memory_order_release); // ← release barrier

// Поток-потребитель:
if (ready.load(std::memory_order_acquire)) {   // ← acquire barrier
    // гарантируется: data.x и data.y уже записаны
    std::cout << data.x << ", " << data.y << "\n";
}

Это — основа lock-free структур (std::shared_ptr, std::atomic<T*>, ring buffers).

Современные паттерны

Policy-Based Design (А. Александреску)

Разделение поведения через параметры шаблонов:

template<typename T, typename ThreadingModel = SingleThreaded>
class SmartPtr {
    T* ptr;
    // ThreadingModel::lock(), unlock() вызываются при доступе
};

Преимущество: выбор стратегии на этапе компиляции — SingleThreaded сводится к пустым inline-функциям.

CRTP (Curiously Recurring Template Pattern)

Статическое полиморфное наследование без виртуальных таблиц:

template<typename Derived>
struct Base {
    void interface() {
        static_cast<Derived*>(this)->implementation();
    }
};

struct MyType : Base<MyType> {
    void implementation() { std::cout << "MyType\n"; }
};

Используется в std::enable_shared_from_this, Eigen, Boost.Iterator.

Type Erasure (стирание типов)

Реализация интерфейса без виртуальных функций в пользовательском коде:

class Any {
    struct Concept { virtual ~Concept() = default; };
    template<typename T> struct Model : Concept { T data; };
    std::unique_ptr<Concept> ptr;
};

Это — основа std::function, std::any, std::variant (частично).

Инструменты анализа

Инструмент	Назначение	Особенность
Clang Static Analyzer	Анализ потока данных, утечки, null-dereference	Интеграция в Xcode, open-source
PVS-Studio	Коммерческий анализатор, ориентированный на промышленные стандарты (MISRA, AUTOSAR)	Поддержка C++20, межъединичный анализ
Cppcheck	Бесплатный статический анализатор	Хорош для CI (лёгкий, быстрый)
MISRA C++:2008/2023	Стандарт безопасности для embedded (автомобильная, авиационная промышленность)	Запрещает динамические аллокации, исключения, рекурсию в критических системах
Clang-Tidy	Линтер + рефакторинг	Правила вроде `modernize-use-nullptr`, `performance-unnecessary-copy-initialization`

Пример правила Clang-Tidy:

clang-tidy main.cpp -- -std=c++20 -Iinclude

→ предупредит, если std::vector инициализируется через копию вместо std::move.

Freestanding Implementation

Стандарт C++ делит реализации на две категории:

Hosted — полная поддержка стандартной библиотеки (<iostream>, <vector>, исключения);
Freestanding — только ядро языка + заголовки: <cstddef>, <new>, <type_traits>, <atomic>, <coroutine> (частично).

Для embedded, ядер ОС, bootloaders используется freestanding mode:

// no #include <iostream>, no main() with args
extern "C" void _start() {
    // инициализация сегментов .data, .bss вручную
    // вызов глобальных конструкторов (если разрешено)
    kernel_main();
    __builtin_unreachable();
}

void kernel_main() {
    // можно использовать:
    // - размещение объектов (placement new)
    // - шаблоны (std::array, std::span)
    // - constexpr
    // - atomics
    // но не: std::cout, malloc, exceptions
}

Ключевые ограничения:

нет main() — точка входа задаётся линкером;
нет динамической памяти (если не реализована вручную);
исключения и RTTI обычно отключены (-fno-exceptions -fno-rtti);
глобальные объекты инициализируются статически (через .init_array или вручную).

Пример: ядро seL4 (C+少量C++) использует freestanding C++11+ с -fno-exceptions, -fno-rtti, -fno-threadsafe-statics.

C++ в контексте системных языков: Rust, Zig, Carbon

Критерий	C++	Rust	Zig	Carbon (experimental)
Безопасность памяти по умолчанию	❌ (требует дисциплины)	✅ (borrow checker)	❌ (но есть анализ в runtime/compile-time)	✅ (planned)
Производительность	✅ (нулевой overhead)	✅ (но иногда нужно `unsafe`)	✅ (C ABI, no hidden cost)	?
Совместимость с C	✅ (полная)	✅ (через `extern "C"`)	✅ (прямая, без wrapper’ов)	✅ (goal)
Модель владения	RAII (ручная)	ownership + borrow checker	optional explicit ownership	?
Компиляция	многоступенчатая (CPP → TU → link)	единая единица (crate)	единая (но с композицией)	модульная (planned)
Стандарт	ISO (раз в 3 года)	RFC-driven community	самодостаточный компилятор	Google-led experiment
Сложность языка	⚠️ (огромная)	⚠️ (сложная модель заимствований)	✅ (минималистичный синтаксис)	?

Rust — альтернатива в нишах, где безопасность важнее гибкости. Он решает другую задачу: писать безопасный системный код без сборщика мусора. Но:

unsafe блоки всё равно нужны для драйверов, FFI, lock-free;
компиляция медленнее;
ABI менее стабилен (в отличие от C++ ABI в MSVC/GCC).

Zig — «C, но лучше»: фокус на простоте, отладке, совместимости. Позволяет:

импортировать заголовки C напрямую (@cImport);
писать comptime-логику (как constexpr, но мощнее);
использовать defer (как RAII, но без классов).

Carbon (эксперимент от Google) — попытка модернизировать C++ без breaking changes, через новый язык с двусторонней совместимостью. Пока — research project.

Совместимость версий

C++ сталкивается с уникальной проблемой: миллиарды строк legacy-кода, написанных под C++98/03, должны продолжать компилироваться и линковаться с новым кодом — без пересборки. Это достигается через:

1. Стабильность ABI на уровне реализации

MSVC гарантирует стабильность ABI в пределах одного major-релиза (например, VS 2019 — v142 toolset). Изменения ABI происходят при смене toolset’а (v142 → v143).
GCC стабилен в пределах major-версии (GCC 11.x), но может менять ABI между ними (например, std::string — COW до GCC 5, SSO после).
Clang+libc++ — стабильность на уровне версии libc++ (ABI tags: _LIBCPP_ABI_VERSION=2 и т.д.).

2. Symbol versioning (Linux)

В .so-библиотеках символы могут иметь версионные метки:

_ZNSt6vectorIiSaIiEE5clearEv@GLIBCXX_3.4
_ZNSt6vectorIiSaIiEE5clearEv@@GLIBCXX_3.4.21

Позволяет одномоментно поддерживать несколько ABI в одной библиотеке.

3. Inline namespaces (C++11+)

Механизм плавного обновления интерфейсов без изменения имени пространства имён:

namespace std {
inline namespace v2 {
    void new_algorithm();
}
namespace v1 {
    void old_algorithm();
}
} // end namespace std

Пользователь пишет std::new_algorithm(), но линковка идёт в std::v2::new_algorithm. Это — основа literals:

using namespace std::literals;
auto s = "hello"s; // std::string, а не const char*

4. Dual ABI (GCC 5+)

Для std::string и std::list GCC ввёл двойной ABI: старый (COW) и новый (SSO). Переключается флагом _GLIBCXX_USE_CXX11_ABI=0/1.

💡 Практическое правило: линкуйте все компоненты проекта одним компилятором и одной версией стандартной библиотеки. Смешивание MSVC+Clang или GCC 10+GCC 13 — почти всегда приведёт к UB.

Нестандартные расширения

Стандарт C++ — это минимум, который обязан поддерживать компилятор. Реальные компиляторы добавляют расширения для:

совместимости с ОС;
отладки;
низкоуровневого контроля;
межъязыкового взаимодействия.

GCC/Clang

Расширение	Назначение
`__attribute__((packed))`	отключает выравнивание полей в структуре (для работы с сетевыми/дискретными протоколами)
`__attribute__((noreturn))`	функция не возвращает управление (например, `abort()`)
`__builtin_expect(cond, likely)`	подсказка ветвлению (`if (__builtin_expect(x == 0, 0))`)
`__thread` / `thread_local`	TLS (thread-local storage) до C++11
`__VA_OPT__`	условное расширение в variadic macros

MSVC

Расширение	Назначение
`__declspec(dllexport)` / `dllimport`	экспорт/импорт символов в DLL
`#pragma comment(lib, "libname")`	автоматическая линковка библиотеки
`__forceinline`	принудительный инлайн (сильнее `inline`)
`__uuidof(T)`	получение GUID COM-интерфейса
`#pragma once`	нестандартная, но широко поддерживаемая защита от повторного включения

Специализированные подмножества

CUDA C++ — расширение для GPU: __global__, __device__, __host__, unified memory.
C++/CLI — управляемый C++ для .NET: ref class, gcnew, ^ (handle), cli::array<T>^. Не является ISO C++ — отдельный язык.
OpenMP — #pragma omp parallel for — простая параллелизация циклов.

⚠️ Важно: расширения не переносимы. Используйте их только при явной необходимости и изолируйте через макросы:

#ifdef _MSC_VER
    __declspec(noinline) void f();
#elif defined(__GNUC__)
    __attribute__((noinline)) void f();
#else
    void f(); // fallback
#endif

Инструменты профилирования

Производительность C++-кода нельзя оценивать «на глаз». Требуются инструменты:

Инструмент	Платформа	Особенность
perf (Linux)	Linux	sampling-based, hardware counters (cycles, cache misses, branches), `perf record -g ./app` → flame graph
VTune Profiler (Intel)	Cross-platform	top-down microarchitecture analysis, memory access patterns, thread contention
Tracy	Cross-platform (open-source)	instrumentation-based, real-time timeline, lock profiling, allocation tracing — встраивается в код
heaptrack	Linux	трекинг аллокаций: кто выделяет, сколько, и не освобождает
gprof	Legacy	устарел: не работает с оптимизированным кодом, не поддерживает многопоточность

Пример использования Tracy:

#define TRACY_ENABLE
#include <Tracy.hpp>

void heavy_computation() {
    ZoneScoped; // автоматически измеряет время выполнения
    for (int i = 0; i < 1000000; ++i) {
        // ...
    }
}

→ Запуск ./app + Tracy-client → интерактивный timeline с call stack’ами, allocation heatmap’ом, lock waits.

C++ в научных вычислениях и HPC

Высокопроизводительные вычисления (HPC), машинное обучение, физика, биоинформатика — всё чаще используют C++ как хост-язык для ядер вычислений.

Почему C++?

Нулевой overhead при вызове CUDA/HIP/SYCL ядер;
Возможность писать векторизуемый код (#pragma omp simd, __builtin_assume_aligned);
Интеграция с BLAS/LAPACK через интерфейсы на C;
Выразительность шаблонов для generic linear algebra.

Ключевые библиотеки:

Библиотека	Назначение	Особенность
Eigen	линейная алгебра (матрицы, векторы, разложения)	header-only, expression templates, SIMD auto-vectorization
Armadillo	MATLAB-подобный API, лёгкая интеграция с LAPACK	`mat A = randu<mat>(5,5);`
xTensor	тензорные вычисления (релятивистская физика)	символьные выражения, code generation
oneAPI DPC++ / SYCL	единый код для CPU/GPU/FPGA	стандарт Khronos, поддержка USM (Unified Shared Memory)

Пример: Eigen + OpenMP

#include <Eigen/Dense>
#include <omp.h>

Eigen::MatrixXd A = Eigen::MatrixXd::Random(1000, 1000);
Eigen::MatrixXd B = Eigen::MatrixXd::Random(1000, 1000);

// Eigen автоматически использует BLAS, но можно контролировать:
#pragma omp parallel for
for (int i = 0; i < A.rows(); ++i) {
    A.row(i) *= 2.0;
}

Eigen::MatrixXd C = A * B; // вызовет ?GEMM из BLAS

C++ здесь — движок, на котором работает PyTorch (libtorch), TensorFlow (TFRT), ROOT (CERN).

Безопасность как приоритет

C++ не может игнорировать проблему memory safety — особенно на фоне успеха Rust. Ответ — безопасные подмножества и статический контроль.

CppCoreGuidelines (Bjarne Stroustrup & Herb Sutter)

https://isocpp.github.io/CppCoreGuidelines
— рекомендации по написанию безопасного, эффективного кода.

Ключевые правила:

I.4: «Make interfaces precisely and strongly typed»
→ избегайте void*, int для идентификаторов — используйте strong typedef’ы:
```
struct UserId { int value; };
void send_email(UserId u); // не send_email(int id)
```
R.2: «Use smart pointers, not raw pointers»
→ unique_ptr, shared_ptr, span вместо T*.
ES.49: «If you must use a cast, use a named cast»
→ static_cast, dynamic_cast, reinterpret_cast, const_cast — не C-style (T)x.

Guidelines Support Library (GSL)

Реализация ключевых идиом из CppCoreGuidelines:

#include <gsl/gsl>

gsl::span<int> process(gsl::span<const int> data) {
    // span — view на [ptr, size), проверяет выход за границы в debug
    Expects(!data.empty()); // Contract checking
    return data.subspan(0, 1);
}

gsl::owner<T*> — маркер: «этот указатель владеет памятью»;
gsl::not_null<T*> — гарантия ненулевого указателя;
gsl::span<T> — безопасная замена «указателю + длине».

MISRA C++ и AUTOSAR C++

Промышленные стандарты для автомобильной и аэрокосмической отраслей:

запрет исключений;
запрет рекурсии;
ограничение глубины вложенности;
запрет динамических аллокаций после старта.

Пример правила AUTOSAR:

Rule A13-5-1: A function shall not have more than 5 levels of nesting.

Microsoft GSL, clang-tidy, PVS-Studio — автоматизация

clang-tidy --checks=cppcoreguidelines-*,-performance-*
PVS-Studio: поддержка MISRA C++:2008 и AUTOSAR C++14.

Основы C++​

Добро пожаловать в мир C++​

Почему C++ до сих пор актуален, несмотря на «более удобные» языки?​

Архитектурные основы​

1. Единица трансляции (translation unit)​

2. Заголовочные файлы​

3. Компиляция → Линковка → Выполнение​

Синтаксис​

Пространства имён​

Перегрузка операторов​

Классы​

Шаблоны​

Стандарты и эволюция​

RAII​

Стандартная библиотека C++​

C++ и C#​

Современный инструментарий​

Сборка​

Управление зависимостями​

Санитайзеры​

Модули (C++20)​

Перспективы​

Единица трансляции​

Совместимость с C​

Мономорфизация, code bloat и концепты​

Концепты (C++20)​

Исключения​

Философия «pay for what you use»​

Header Units и Modules​

Модель памяти и многопоточность​

Пример: data race и его устранение​

Атомарные операции​

Современные паттерны​

Policy-Based Design (А. Александреску)​

CRTP (Curiously Recurring Template Pattern)​

Type Erasure (стирание типов)​

Инструменты анализа​

Freestanding Implementation​

C++ в контексте системных языков: Rust, Zig, Carbon​

Совместимость версий​

1. Стабильность ABI на уровне реализации​

2. Symbol versioning (Linux)​

3. Inline namespaces (C++11+)​

4. Dual ABI (GCC 5+)​

Нестандартные расширения​

GCC/Clang​

MSVC​

Специализированные подмножества​

Инструменты профилирования​

C++ в научных вычислениях и HPC​

Почему C++?​

Ключевые библиотеки:​

Безопасность как приоритет​

CppCoreGuidelines (Bjarne Stroustrup & Herb Sutter)​

Guidelines Support Library (GSL)​

MISRA C++ и AUTOSAR C++​

Microsoft GSL, clang-tidy, PVS-Studio — автоматизация​