Работа с данными и структурами

ОБЯЗАТЕЛЬНОДЛЯ НОВИЧКОВ

Разработчику Архитектору

См. также: Типы данных и владение · Важные трейты и типы (Операции Vec / HashMap)

Работа с данными и структурами

Эту статью удобно проходить как практический маршрут от форматов данных к реальным запросам и обратно в API-ответы. Для связного чтения держите рядом важные трейты и типы, первая программа на Axum, тестирование и Cargo workspace.

Работа с базами данных в Rust охватывает два основных направления — взаимодействие с реляционными (SQL) и нереляционными (NoSQL) системами хранения, а также обработка структурированных форматов данных, таких как JSON и XML. Каждое из этих направлений имеет свои инструменты, библиотеки и рекомендованные практики.

Интерактивная лаборатория

Play ITЗагрузка интерактивного демо…

Демо показывает стек доступа (приложение → ORM/драйвер → пул → PostgreSQL), пошаговые сценарии запросов, CRUD-лабораторию с живой таблицей и параллельным SQL, сравнение tokio-postgres · Diesel · SeaORM, жизненный цикл соединения и поток POST /users (Axum → serde → SeaORM → JSON). Ниже в тексте — те же темы подробнее.

Обработка структурированных данных — JSON и XML

Перед сохранением или после извлечения данных из базы часто требуется сериализация или десериализация. Rust предоставляет мощные средства для этого через экосистему serde.

Библиотека serde является стандартом де-факто для работы с сериализацией в Rust. Она позволяет преобразовывать структуры Rust в JSON, XML, YAML, TOML и другие форматы, а также выполнять обратное преобразование. Serde работает на основе макросов, которые автоматически генерируют код для сериализации и десериализации, исходя из определения структуры данных.

Для работы с JSON используется crate serde_json. Он поддерживает как парсинг строки в структуру Rust, так и сериализацию структуры в строку или поток байтов. Типажи Serialize и Deserialize применяются к пользовательским структурам с помощью атрибута #[derive(Serialize, Deserialize)]. Имена полей и сериализация задаются на этапе компиляции (#[serde(rename = "...")]), но несовпадение ключей в входящем JSON (лишние/неизвестные поля) обнаруживается при десериализации в runtime, если не отключено явно.

Пример:

use serde::{Deserialize, Serialize};

#[derive(Serialize, Deserialize)]
struct User {
    id: u32,
    name: String,
    email: String,
}

Разбор:

use serde::{Deserialize, Serialize}; импортирует derive-макросы и трейты, которые позволяют автоматически превращать структуру в JSON/XML/BSON и обратно.
Атрибут #[derive(Serialize, Deserialize)] генерирует реализацию сериализации и десериализации во время компиляции, без ручного написания кода преобразования.
struct User задаёт модель данных с тремя полями, где типы (u32, String) определяют ожидаемый формат входа и выхода.
Поле id: u32 предполагает неотрицательный идентификатор; при десериализации Rust проверяет, что значение действительно укладывается в диапазон u32.
Поля name и email типа String означают владение строковыми данными: структура хранит собственные копии, а не ссылки на внешний буфер.
Такой шаблон обычно используют как DTO: входящий JSON мапится в User, затем структура участвует в бизнес-логике и в ответе API.

Такой подход обеспечивает безопасность — попытка получить поле, которого нет в JSON, или передать неверный тип данных приведёт к ошибке на этапе десериализации, а не к неопределённому поведению во время выполнения.

Для XML применяется crate serde_xml_rs или quick-xml. Quick-xml предлагает более низкоуровневый, но быстрый интерфейс, ориентированный на потоковую обработку XML без полной загрузки документа в память. Serde_xml_rs, напротив, интегрируется с serde и позволяет использовать те же структуры, что и для JSON, но с XML-разметкой. Это удобно при работе с API, которые предоставляют данные в разных форматах.

Все эти инструменты совместимы с асинхронными средами выполнения, такими как Tokio или async-std, что позволяет эффективно обрабатывать данные в веб-приложениях и микросервисах.

Работа с реляционными базами данных (SQL)

Rust предлагает несколько уровней абстракции для взаимодействия с SQL-базами данных: от чистых SQL-запросов через драйверы до полноценных ORM. В интерактиве выше можно переключать эти уровни и сразу видеть, какой SQL уходит в СУБД.

Низкоуровневые драйверы

Каждая популярная СУБД имеет свой драйвер в экосистеме Rust:

PostgreSQL: tokio-postgres (асинхронный), postgres (синхронный)
MySQL: mysql_async, mysql
SQLite: rusqlite (синхронный), libsqlite3-sys с обёртками для асинхронности
Microsoft SQL Server: tiberius

Эти драйверы предоставляют прямой доступ к протоколу базы данных. Они позволяют выполнять SQL-запросы, получать результаты, работать с транзакциями и параметризованными запросами. Параметризованные запросы защищают от SQL-инъекций, так как значения передаются отдельно от текста запроса и интерпретируются как данные, а не как исполняемый код.

Пример с tokio-postgres:

Код ITЗагрузка примера кода…

Разбор:

Атрибут #[tokio::main] создаёт точку входа с асинхронным runtime Tokio, поэтому main может использовать await.
Сигнатура Result<(), Box<dyn std::error::Error>> показывает, что функция возвращает либо успех (), либо любую ошибку, реализующую Error.
tokio_postgres::connect(..., NoTls).await? открывает соединение с PostgreSQL; ? сразу пробрасывает ошибку наверх при неудаче.
Возвращается пара (client, connection): client выполняет запросы, а connection обслуживает протокол и должен постоянно исполняться в фоне.
tokio::spawn(async move { ... connection.await ... }) запускает фоновую задачу, которая поддерживает сетевой обмен и логирует обрывы соединения.
query("... WHERE age > $1", &[&18]) использует параметризованный запрос: $1 связывается со значением 18, что защищает от SQL-инъекций.
Цикл for row in rows читает результат построчно; row.get(0) и row.get(1) извлекают колонки по индексу с проверкой ожидаемого типа.
Финальный Ok(()) сигнализирует, что все этапы (подключение, запрос, вывод) завершились без ошибок.

Такой подход даёт полный контроль над запросами и максимальную производительность, но требует ручного сопоставления строк результата с полями структур Rust.

ORM — Diesel

Diesel — это наиболее зрелый и широко используемый ORM в экосистеме Rust. Он ориентирован на безопасность типов, производительность и предсказуемость. Diesel строится вокруг концепции "безопасного SQL" — большинство ошибок, связанных с несоответствием схемы базы данных и кода приложения, выявляются на этапе компиляции.

Diesel использует макросы и процедурные макросы для генерации типобезопасных запросов. Он поддерживает PostgreSQL, MySQL и SQLite. Основные компоненты Diesel:

Schema: описание таблиц базы данных в виде Rust-кода, генерируемого утилитой diesel_cli.
Models: структуры Rust, представляющие строки таблиц.
Queries: DSL (Domain Specific Language) для построения запросов, который компилируется в корректный SQL.

Diesel разделяет понятия schema и model. Schema описывает структуру таблицы, а model — бизнес-логику и преобразования. Это позволяет избежать дублирования и сохранить гибкость.

Пример модели и запроса:

Код ITЗагрузка примера кода…

Разбор:

Макрос table! из Diesel генерирует типобезопасное описание таблицы users и её колонок, которое затем используется в DSL-запросах.
Блок users (id) обозначает первичный ключ id, а строки id -> Integer, name -> Text, email -> Text задают SQL-типы колонок.
#[derive(Queryable)] на User включает автоматическое преобразование строки результата SQL в экземпляр структуры Rust.
use crate::schema::users; импортирует модуль с типизированными столбцами, чтобы писать выражения вроде users::email.eq(email).
В find_user_by_email параметр &mut PgConnection нужен Diesel для выполнения запроса в рамках открытого соединения.
filter(users::email.eq(email)) строит WHERE-условие в типобезопасной форме и проверяется компилятором до запуска.
.first(conn) запрашивает ровно одну запись и возвращает QueryResult<User>: Ok(User) при успехе или Err при отсутствии/ошибке.
Такой стиль исключает "сырой" SQL в бизнес-коде и снижает риск несоответствия между схемой и моделью.

Diesel проверяет, что поле email существует в таблице users, что оно имеет тип Text, и что сравнение с &str допустимо. Если изменить схему базы данных без обновления кода, компиляция завершится ошибкой.

Diesel не поддерживает асинхронность напрямую. Он предназначен для синхронных приложений или для использования в пуле потоков внутри асинхронного контекста. Это ограничение связано с архитектурными решениями, принятыми на ранних этапах разработки, когда асинхронность в Rust ещё не была стандартизирована.

Diesel применяется в проектах, где важна строгая проверка типов, предсказуемость и производительность — системные сервисы, финансовые приложения, embedded-системы с базами данных, CLI-инструменты.

ORM — SeaORM

SeaORM — современный асинхронный ORM, созданный с учётом особенностей современного Rust. Он полностью асинхронен, поддерживает Tokio и async-std, и ориентирован на разработку веб-приложений и микросервисов.

SeaORM использует Entity-Relationship модель, где каждая таблица представлена как Entity, а строки — как Model. Он предоставляет гибкий DSL для построения запросов, включая сложные JOIN, подзапросы, агрегации и пагинацию.

Особенности SeaORM:

Полная асинхронность: все операции ввода-вывода выполняются без блокировки.
Динамическое построение запросов — условия, сортировка, лимиты могут формироваться в зависимости от логики приложения.
Поддержка миграций через sea-orm-cli.
Интеграция с serde для автоматической сериализации моделей.
Генерация кода на основе существующей базы данных (reverse engineering).

Пример с SeaORM:

Код ITЗагрузка примера кода…

Разбор:

DeriveEntityModel генерирует ORM-сущность SeaORM на основе структуры Model, связывая поля Rust со столбцами таблицы.
Атрибут #[sea_orm(table_name = "users")] явно указывает имя таблицы в БД для этой сущности.
#[sea_orm(primary_key)] помечает id как первичный ключ, что влияет на генерацию запросов и операций обновления.
Relation и ActiveModelBehavior задают каркас для связей и поведения активной модели; в примере связи пока не определены.
В функции find_user_by_email аргумент &DatabaseConnection передаёт пул/соединение в асинхронный запрос.
Entity::find().filter(Column::Email.eq(email)) формирует SELECT с условием WHERE по колонке email.
.one(db).await выполняет запрос асинхронно и возвращает Option<Model>: Some при найденной записи или None, если записи нет.
Общий тип Result<..., DbErr> отделяет бизнес-случай "не найдено" (None) от технической ошибки доступа к БД (Err).

SeaORM активно развивается и поддерживает последние версии Rust. Он хорошо подходит для REST API, GraphQL-серверов, фоновых задач и любых приложений, где асинхронность является ключевым требованием.

Работа с NoSQL-базами данных

Rust также предоставляет инструменты для работы с нереляционными базами данных, хотя экосистема здесь менее зрелая, чем для SQL.

MongoDB

Для MongoDB существует официальный драйвер mongodb, разработанный самой компанией MongoDB. Он полностью асинхронный, поддерживает все основные функции — CRUD-операции, агрегации, транзакции (в репликах), индексы.

Данные в MongoDB представлены как BSON — двоичная форма JSON. Crate bson предоставляет типы Document, Array, DateTime и другие, а также интеграцию с serde. Это позволяет легко преобразовывать структуры Rust в BSON и обратно.

Пример:

Код ITЗагрузка примера кода…

Разбор:

ClientOptions::parse("mongodb://localhost:27017").await? читает URI подключения и подготавливает конфигурацию клиента MongoDB.
Client::with_options(client_options)? создаёт клиент с валидированными параметрами и возможностью дальнейшей работы с БД.
let db = client.database("mydb"); получает хендл конкретной базы, не выполняя тяжёлых операций до первого запроса.
db.collection::<User>("users") задаёт типизированную коллекцию, где документы автоматически мапятся в структуру User.
#[derive(Serialize, Deserialize)] у User позволяет драйверу преобразовать Rust-структуру в BSON при вставке.
collection.insert_one(user, None).await? добавляет один документ; None означает параметры вставки по умолчанию.
Возврат mongodb::error::Result<()> унифицирует обработку ошибок драйвера на уровне main.

Redis

Redis — популярное хранилище ключ-значение — поддерживается через crate redis (синхронный) и redis-rs с асинхронными адаптерами. Он используется для кэширования, очередей сообщений, сессий и временных данных.

Другие NoSQL-системы

Для Cassandra существует cdrs-tokio, для Elasticsearch — elasticsearch-rs, для DynamoDB — AWS SDK for Rust. Эти драйверы обычно предоставляют низкоуровневый API, но могут быть обёрнуты в собственные абстракции при необходимости.

Выбор подхода

Выбор между низкоуровневыми драйверами, Diesel и SeaORM зависит от требований проекта:

Если нужен полный контроль над SQL и максимальная производительность — используются прямые драйверы.
Если приложение синхронное, требует строгой проверки типов и стабильности — выбирается Diesel.
Если приложение асинхронное, масштабируемое, с динамическими запросами — предпочтителен SeaORM.

Все подходы совместимы с обработкой JSON/XML через serde, что обеспечивает единый стиль работы с данными на всех уровнях приложения.

Rust делает работу с базами данных безопасной, эффективной и предсказуемой. Благодаря системе типов и компилятору, многие ошибки, характерные для других языков (неправильные имена полей, несогласованность схемы, SQL-инъекции), исключаются ещё до запуска программы. Это особенно ценно в долгоживущих системах, где стабильность и надёжность имеют первостепенное значение.

Транзакции и согласованность данных

Транзакции — ключевой механизм обеспечения целостности данных в реляционных базах. В Rust работа с транзакциями реализована как на уровне драйверов, так и через ORM. Diesel и SeaORM предоставляют удобные абстракции для управления транзакциями без необходимости писать SQL-команды BEGIN, COMMIT или ROLLBACK вручную.

В Diesel транзакции запускаются с помощью метода transaction() у соединения:

use diesel::Connection;

conn.transaction::<_, diesel::result::Error, _>(|| {
    // несколько операций
    create_user(&mut conn, &user1)?;
    create_profile(&mut conn, &profile1)?;
    Ok(())
})?;

Разбор:

use diesel::Connection; импортирует трейт, который предоставляет метод transaction для соединения Diesel.
transaction::<_, diesel::result::Error, _>(|| { ... }) открывает транзакцию и выполняет переданное замыкание атомарно.
Внутри замыкания вызовы create_user(&mut conn, &user1)? и create_profile(&mut conn, &profile1)? выполняются как единая операция.
Оператор ? после каждого шага мгновенно завершает замыкание при ошибке и инициирует откат (ROLLBACK).
Ok(()) в конце замыкания означает успешное выполнение всех шагов, после чего Diesel делает COMMIT.
Внешний )? пробрасывает ошибку вызывающему коду, если транзакция была отменена или возник сбой выполнения.

Если любая из операций внутри замыкания вернёт ошибку, транзакция автоматически откатится. Это гарантирует атомарность: либо все изменения применяются, либо ни одно.

SeaORM использует аналогичный подход, но в асинхронном контексте:

let txn = db.begin().await?;
User::insert(user).exec(&txn).await?;
Profile::insert(profile).exec(&txn).await?;
txn.commit().await?;

Разбор:

db.begin().await? запускает транзакцию в SeaORM и возвращает объект txn, через который выполняются операции.
User::insert(user).exec(&txn).await? вставляет пользователя внутри транзакционного контекста, а не в "автокоммите".
Profile::insert(profile).exec(&txn).await? добавляет связанную запись тем же транзакционным хендлом.
Если любой из двух exec(...).await? завершается ошибкой, дальнейшее выполнение прерывается и транзакция не коммитится.
txn.commit().await? фиксирует изменения только после успешного выполнения всех промежуточных шагов.
Такой шаблон явно показывает границы атомарной операции и удобно расширяется дополнительными проверками и записями.

Здесь разработчик явно управляет началом и завершением транзакции, что даёт гибкость при работе с распределёнными системами или вложенным логическим уровнем.

Важно помнить: транзакции блокируют ресурсы базы данных. Долгие транзакции могут привести к взаимоблокировкам (deadlocks) или снижению пропускной способности. Поэтому рекомендуется выполнять только необходимые операции внутри транзакции и не включать в неё внешние вызовы (например, HTTP-запросы).

Миграции базы данных

Миграции — это управляемый способ изменения структуры базы данных с течением времени. Они позволяют синхронизировать схему БД с кодом приложения, особенно в командной разработке и при развёртывании в разных окружениях.

Diesel и миграции

Diesel поставляется с CLI-утилитой diesel_cli, которая генерирует шаблоны миграций:

diesel migration generate add_users_table

Разбор:

Команда diesel migration generate add_users_table создаёт новый шаблон миграции с указанным именем.
Diesel CLI формирует директорию миграции с временной меткой и файлами up.sql и down.sql.
up.sql используется для применения изменений схемы, а down.sql — для обратного отката.
Именование add_users_table сразу отражает цель миграции и упрощает навигацию по истории изменений БД.
Этот шаг подготавливает миграцию, но ещё не применяет её к базе данных.

Эта команда создаёт директорию с двумя файлами: up.sql и down.sql. В up.sql описывается применение изменений (например, CREATE TABLE users), в down.sql — их откат (DROP TABLE users).

Миграции применяются командой:

diesel migration run

Разбор:

diesel migration run последовательно применяет все новые миграции, которые ещё не отмечены как выполненные.
Команда читает метаданные из служебной таблицы _diesel_schema_migrations и не запускает уже применённые шаги повторно.
Если миграция завершается ошибкой, процесс останавливается на проблемном шаге, сохраняя предсказуемость состояния.
Обычно команду запускают при локальной разработке, в CI и на этапе деплоя для синхронизации схемы.
Это базовая операция сопровождения БД, которая держит код и структуру данных в одном состоянии.

Diesel сохраняет историю применённых миграций в служебной таблице _diesel_schema_migrations, что предотвращает повторное выполнение.

SeaORM и миграции

SeaORM предоставляет собственный инструмент sea-orm-cli, который поддерживает как SQL-миграции, так и программные миграции на Rust:

Код ITЗагрузка примера кода…

Разбор:

pub struct Migration; объявляет тип миграции, который реализует нужные трейты SeaORM migration API.
impl MigrationName for Migration задаёт стабильное имя миграции через name(), по которому SeaORM ведёт порядок выполнения.
Атрибут #[async_trait::async_trait] позволяет реализовать асинхронные методы up и down в трейте миграции.
В up вызывается manager.create_table(...), где через builder Table::create() описываются колонки и ограничения.
ColumnDef::new(...).integer().not_null().auto_increment().primary_key() показывает цепочку методов конфигурации столбца id.
В down вызывается drop_table(...), что задаёт обратимое изменение схемы и делает миграцию безопасной для rollback.
.to_owned() завершает построение SQL-описания, превращая builder в готовую структуру команды.
await на операциях менеджера означает реальный асинхронный вызов к СУБД в момент выполнения миграции.

Программные миграции на Rust имеют преимущество: они типобезопасны и могут использовать общую модель данных, определённую в основном коде. Это снижает риск рассогласования между миграцией и моделью.

Пул соединений

Установка нового соединения с базой данных — дорогая операция. Для повышения производительности Rust-приложения используют пулы соединений. Пул создаёт набор готовых соединений при старте и переиспользует их между запросами.

Синхронные пулы

Для Diesel часто используется r2d2 — универсальный пул соединений, совместимый с любыми драйверами, реализующими трейт ManageConnection. Пример:

use diesel::r2d2::{ConnectionManager, Pool};

type PgPool = Pool<ConnectionManager<PgConnection>>;

let manager = ConnectionManager::<PgConnection>::new(database_url);
let pool = Pool::builder()
    .max_size(15)
    .build(manager)
    .expect("Failed to create pool");

Разбор:

ConnectionManager<PgConnection> описывает, как пул должен создавать и возвращать PostgreSQL-соединения Diesel.
Алиас type PgPool = Pool<ConnectionManager<PgConnection>>; упрощает сигнатуры функций и структуру состояния приложения.
ConnectionManager::new(database_url) связывает менеджер с DSN/URL конкретной базы данных.
Pool::builder().max_size(15) настраивает верхний предел одновременных открытых соединений в пуле.
.build(manager) инициализирует пул и заранее подготавливает инфраструктуру выдачи соединений.
.expect("Failed to create pool") аварийно завершит запуск, если пул не удалось создать, что обычно корректно для старта сервиса.

Приложение берёт соединение из пула, выполняет запрос, и соединение автоматически возвращается в пул после выхода из области видимости.

Асинхронные пулы

Для SeaORM и других асинхронных драйверов используется bb8 — асинхронный аналог r2d2. Однако большинство современных ORM, включая SeaORM, уже встроили управление пулом внутрь. Например, при создании подключения к базе через Database::connect(), SeaORM автоматически настраивает пул с параметрами по умолчанию, которые можно настроить через ConnectOptions.

Это упрощает разработку: разработчику не нужно думать о пуле напрямую, достаточно передавать DatabaseConnection в функции.

Обработка ошибок

Rust не использует исключения. Все ошибки возвращаются явно через тип Result<T, E>. Это особенно важно при работе с базами данных, где возможны сетевые сбои, нарушения ограничений (например, уникальность), истечение времени ожидания и другие проблемы.

Diesel определяет свой тип ошибки diesel::result::Error, который включает варианты вроде NotFound, DatabaseError, RollbackTransaction. Это позволяет точно реагировать на разные ситуации:

match find_user(conn, id) {
    Ok(user) => Ok(user),
    Err(diesel::result::Error::NotFound) => Err(UserError::NotFound),
    Err(e) => Err(UserError::Database(e)),
}

Разбор:

match выполняет явное ветвление по всем вариантам Result, делая обработку ошибок читаемой и полной.
Ветка Ok(user) => Ok(user) прозрачно пробрасывает успешный результат без модификации.
Отдельная обработка Err(diesel::result::Error::NotFound) конвертирует отсутствие записи в доменную ошибку UserError::NotFound.
Общая ветка Err(e) собирает остальные ошибки БД и заворачивает их в UserError::Database(e) для централизованного логирования и ответа API.
Такой шаблон изолирует внутренние детали Diesel от внешнего слоя приложения и стабилизирует контракт ошибок.

SeaORM использует тип DbErr, который также детализирован — RecordNotFound, Query, Migration, Connection и другие. Это помогает строить осмысленные ответы API или логировать ошибки с контекстом.

Хорошая практика — не пропускать ошибки базы данных на уровень пользователя без преобразования. Вместо этого их следует оборачивать в доменные ошибки приложения, чтобы не раскрывать внутреннюю структуру БД.

Сериализация моделей в JSON и обмен данными

В веб-приложениях данные, извлечённые из базы, часто передаются клиентам в формате JSON. Rust позволяет легко интегрировать модели базы данных с HTTP-слоем через библиотеку serde.

Модели Diesel или SeaORM могут напрямую реализовывать трейты Serialize и Deserialize. Например:

#[derive(Queryable, Serialize)]
pub struct User {
    pub id: i32,
    pub name: String,
    pub email: String,
}

Разбор:

#[derive(Queryable, Serialize)] объединяет два слоя: модель можно получить из Diesel-запроса и сразу сериализовать в JSON.
Queryable отвечает за маппинг строки SQL-результата в поля структуры в правильном порядке и типах.
Serialize позволяет serde преобразовать экземпляр User в JSON-объект при формировании HTTP-ответа.
Поля pub делают данные доступными внешним модулям, что удобно для DTO-конверсии и API-слоя.
Такой вариант полезен в простых кейсах, но в production часто добавляют отдельные response-структуры для скрытия чувствительных полей.

Такая структура может быть сразу преобразована в JSON с помощью serde_json::to_string() или автоматически сериализована фреймворком (например, Axum или Actix Web).

Однако на практике модель базы данных редко совпадает с API-представлением. Часто требуется:

скрыть внутренние поля (например, password_hash);
добавить вычисляемые поля (например, full_name);
изменить имена полей для соответствия соглашениям API.

Для этого создаются отдельные структуры — DTO (Data Transfer Objects):

Код ITЗагрузка примера кода…

Разбор:

#[derive(Serialize)] подготавливает UserResponse к отправке клиенту как JSON без ручной сериализации.
UserResponse выступает DTO-слоем и отделяет публичный формат API от внутренней модели базы.
Реализация From<User> for UserResponse задаёт стандартный путь преобразования через UserResponse::from(user).
Внутри from каждое поле копируется или переносится явно, поэтому разработчик контролирует, какие данные попадут в ответ.
created_at: Utc::now() демонстрирует добавление вычисляемого поля, которое не обязано храниться в исходной модели.
Такой паттерн облегчает версионирование API и безопасное развитие схемы данных без ломки внешнего контракта.

Такой подход обеспечивает чёткое разделение между слоем данных и слоем представления. Он также упрощает версионирование API: можно вводить новые DTO без изменения моделей.

Валидация данных

Валидация — обязательный этап при приёме данных от пользователя. Она выполняется до сохранения в базу и после десериализации JSON.

Rust не имеет встроенной системы валидации, но экосистема предлагает несколько решений:

validator — популярная библиотека, предоставляющая макросы для проверки длины строк, формата email, диапазонов чисел и пользовательских правил.
custom logic — ручная проверка в конструкторах или методах new.

Пример с validator:

Код ITЗагрузка примера кода…

Разбор:

use validator::{Validate, ValidationError}; подключает derive-трейт и тип ошибки библиотеки валидации.
#[derive(Deserialize, Validate)] на структуре объединяет два шага входной обработки: парсинг JSON и последующую проверку ограничений.
#[validate(length(min = 2, max = 50))] задаёт длину строки имени на уровне декларации поля.
#[validate(email)] проверяет формат e-mail по встроенному валидатору.
serde_json::from_str(body)? десериализует тело запроса в CreateUserRequest, отлавливая синтаксические ошибки JSON.
request.validate()? запускает правила валидации и прерывает выполнение при первом наборе нарушений.
Такой pipeline отделяет ошибки формата данных от ошибок бизнес-ограничений и упрощает ответы API.

Если валидация не проходит, возвращается структура ValidationErrors, которую можно преобразовать в понятный пользователю ответ.

Важно — валидация на уровне приложения дополняет, но не заменяет ограничения базы данных (NOT NULL, UNIQUE, CHECK). Оба уровня необходимы для надёжности.

Кэширование запросов

Часто запрашиваемые данные (например, профиль пользователя, справочники) выгодно кэшировать, чтобы снизить нагрузку на базу.

Rust предлагает несколько решений:

In-memory cache — moka, dashmap, lru — для хранения данных в памяти процесса.
Redis: как внешний кэш, особенно в распределённых системах.

Пример с moka:

use moka::future::Cache;

let user_cache: Cache<i32, User> = Cache::new(10_000);

async fn get_user(id: i32, db: &DatabaseConnection, cache: &Cache<i32, User>) -> Result<User, Error> {
    if let Some(user) = cache.get(&id) {
        return Ok(user);
    }

    let user = fetch_user_from_db(db, id).await?;
    cache.insert(id, user.clone()).await;
    Ok(user)
}

Разбор:

Cache<i32, User> задаёт асинхронный in-memory кэш, где ключом выступает id пользователя, а значением — структура User.
Cache::new(10_000) ограничивает размер кэша и задаёт его ёмкость по количеству элементов.
В get_user сначала выполняется быстрый lookup cache.get(&id); при попадании функция сразу возвращает данные без обращения к БД.
При промахе вызывается fetch_user_from_db(db, id).await?, что делает источник истины базой данных.
cache.insert(id, user.clone()).await кладёт полученное значение в кэш для следующих запросов.
Возврат Ok(user) отдаёт клиенту актуальный результат независимо от того, пришёл он из кэша или из БД.
Шаблон cache-aside снижает латентность и нагрузку на хранилище при горячих ключах.

Кэширование требует стратегии инвалидации: при обновлении данных в базе соответствующий ключ должен быть удалён из кэша. Это можно реализовать через события, триггеры или простое TTL-истечение.

Работа с большими объёмами данных

При обработке миллионов записей важно избегать загрузки всего набора в память. Rust поддерживает потоковую обработку:

Diesel: метод load_in_batches() позволяет загружать данные порциями.
SeaORM: поддержка пагинации через Paginator.
Низкоуровневые драйверы: курсоры (cursors) в PostgreSQL (DECLARE CURSOR) позволяют итерироваться по результату без полной загрузки.

Пример пагинации в SeaORM:

let mut paginator = Entity::find()
    .paginate(db, 100); // 100 записей на страницу

while let Some(items) = paginator.fetch_and_next().await? {
    for item in items {
        process(item).await;
    }
}

Разбор:

Entity::find().paginate(db, 100) создаёт пагинатор SeaORM с размером страницы 100 записей.
Переменная paginator хранит состояние итерации и смещается после каждого вызова fetch_and_next.
Конструкция while let Some(items) = ... продолжает цикл, пока есть следующая порция данных.
fetch_and_next().await? загружает очередную страницу асинхронно и одновременно сдвигает внутренний курсор.
Внутренний for item in items обрабатывает конкретные записи этой страницы без загрузки всего набора в память.
Такой подход уменьшает потребление RAM и позволяет обрабатывать большие таблицы потоково.

Такой подход минимизирует потребление памяти и позволяет обрабатывать данные в реальном времени.

Для массовой вставки (bulk insert) рекомендуется использовать:

COPY в PostgreSQL (через tokio-postgres-copy);
с ограниченным числом строк;

INSERT INTO ... VALUES (...), (...), ...

Разбор:

Это шаблон bulk insert: один SQL-запрос вставляет сразу несколько строк за один сетевой round-trip к базе.
INSERT INTO указывает целевую таблицу, а блок VALUES перечисляет набор кортежей данных.
Подход уменьшает накладные расходы сети и транзакционного журнала по сравнению с серией одиночных INSERT.
На практике в многоточиях должны быть конкретные имена колонок и параметризованные значения из приложения.
Для очень больших партий обычно добавляют батчирование по размеру, чтобы не превышать лимиты пакета и памяти СУБД.
транзакции для группировки операций.

Интеграция с веб-фреймворками

Axum

Axum — современный веб-фреймворк, построенный на Tower и Hyper. Он отлично сочетается с SeaORM благодаря асинхронности.

Пример обработчика:

use axum::{Json, extract::State};
use sea_orm::DatabaseConnection;

async fn create_user(
    State(db): State<DatabaseConnection>,
    Json(payload): Json<CreateUserRequest>,
) -> Result<Json<UserResponse>, AppError> {
    let user = User::create(payload).exec(&db).await?;
    Ok(Json(UserResponse::from(user)))
}

Разбор:

use axum::{Json, extract::State}; подключает экстракторы Axum для чтения состояния приложения и JSON-тела.
Аргумент State(db): State<DatabaseConnection> извлекает подключение и пул БД из состояния роутера.
Json(payload): Json<CreateUserRequest> автоматически десериализует входной JSON в типизированную структуру запроса.
User::create(payload).exec(&db).await? выполняет асинхронное создание пользователя в базе и пробрасывает ошибку через ?.
Ok(Json(UserResponse::from(user))) преобразует доменную модель в DTO и возвращает её клиенту как JSON-ответ.
Сигнатура Result<..., AppError> задаёт единый контракт ошибок обработчика, удобный для middleware и общего error-handler.

Состояние приложения (включая пул соединений) передаётся через State.

Actix Web

Actix Web использует другой подход — данные внедряются через web::Data:

use actix_web::{web, HttpResponse};

async fn get_user(
    db: web::Data<DatabaseConnection>,
    path: web::Path<i32>,
) -> Result<HttpResponse, AppError> {
    let user = User::find_by_id(path.into_inner()).one(&*db).await?;
    Ok(HttpResponse::Ok().json(user))
}

Разбор:

web::Data<DatabaseConnection> в Actix Web служит контейнером для разделяемого состояния приложения.
web::Path<i32> извлекает параметр пути и типизирует его как i32, исключая ручной парсинг строки URL.
path.into_inner() достаёт чистое значение id из обёртки маршрутизатора.
User::find_by_id(...).one(&*db).await? выполняет асинхронный запрос к БД и получает пользователя по первичному ключу.
HttpResponse::Ok().json(user) формирует HTTP 200 и сериализует объект в JSON-тело ответа.
Возврат Result<HttpResponse, AppError> поддерживает единообразную обработку ошибок на уровне фреймворка.

Оба фреймворка поддерживают middleware, обработку ошибок и валидацию, что делает интеграцию с базой данных прозрачной.

Сравнение производительности — Diesel и SeaORM

Diesel компилирует запросы в статический SQL на этапе сборки, что даёт минимальные накладные расходы во время выполнения. Он быстрее в синхронных сценариях и потребляет меньше памяти.

SeaORM генерирует SQL динамически, что добавляет небольшие накладные расходы, но обеспечивает гибкость. Его производительность достаточна для большинства веб-приложений, особенно при использовании пула соединений и кэширования.

Выбор не должен основываться только на производительности. Архитектурные требования — синхронность, типобезопасность, поддержка миграций — играют большую роль.

Безопасность при работе с базами данных

Безопасность — неотъемлемая часть любого приложения, взаимодействующего с данными. Rust помогает избежать многих классических уязвимостей благодаря своей системе типов и принудительной обработке ошибок, но разработчик всё равно несёт ответственность за корректное проектирование.

Защита от SQL-инъекций

SQL-инъекции возникают, когда пользовательский ввод интерпретируется как часть SQL-кода. В Rust эта проблема практически исключена при соблюдении базовых правил:

Все ORM (Diesel, SeaORM) используют параметризованные запросы по умолчанию. Значения передаются отдельно от текста запроса и никогда не интерполируются в строку.
При использовании низкоуровневых драйверов (например, tokio-postgres) следует избегать конкатенации строк для формирования SQL. Вместо этого применяются placeholders ($1, $2 в PostgreSQL; ? в SQLite/MySQL).

Пример безопасного запроса:

client.query("SELECT * FROM users WHERE email = $1", &[&email]).await?;

Разбор:

client.query(...) выполняет SQL-запрос через драйвер PostgreSQL и возвращает набор строк результата.
Плейсхолдер $1 в тексте SQL задаёт позиционный параметр вместо прямой подстановки пользовательской строки.
&[&email] передаёт параметры отдельно от SQL-текста, поэтому значение интерпретируется как данные, а не как код.
await? делает вызов асинхронным и сразу пробрасывает сетевую и SQL-ошибку в вызывающую функцию.
Такой формат является базовой техникой защиты от SQL-инъекций и должен применяться для всех внешних входных данных.

Даже если email содержит вредоносный код вроде ' OR '1'='1, он будет обработан как строковое значение, а не как условие.

Утечки данных

Модели базы данных часто содержат чувствительные поля — хэши паролей, токены, внутренние идентификаторы. Чтобы избежать их случайной передачи в API:

Используются отдельные DTO для ответов.
Структуры, предназначенные только для внутреннего использования, не реализуют Serialize.
Включается строгий контроль доступа на уровне бизнес-логики.

Ограничение прав доступа

Учётная запись базы данных, используемая в production, должна иметь минимально необходимые привилегии:

Нет прав на DROP, ALTER, CREATE.
Доступ только к конкретным таблицам.
Отсутствие возможности выполнять произвольные функции или читать системные каталоги.

Это снижает потенциальный ущерб даже в случае компрометации приложения.

Хранение учётных данных

Строки подключения и пароли никогда не хранятся в коде. Они передаются через переменные окружения или секреты (например, Kubernetes Secrets, HashiCorp Vault). Для удобства используется библиотека config или dotenvy, которая загружает .env-файлы только в Разработка-среде.

Тестирование слоя данных

Тестирование — ключевой элемент надёжности. В Rust различают два типа тестов для работы с БД:

Unit-тесты

Unit-тесты проверяют логику без реального подключения к базе. Для этого используются mock-объекты или in-memory реализации. Однако из-за строгой типизации и отсутствия динамической диспетчеризации в Rust полноценное мокирование ORM затруднено.

Поэтому чаще применяется подход: выделяется интерфейс (через трейты), а реализация подменяется в тестах:

Код ITЗагрузка примера кода…

Разбор:

Атрибут #[async_trait] позволяет объявлять асинхронные методы в трейте, что удобно для репозиторного интерфейса.
Трейт UserRepository задаёт контракт доступа к данным: поиск по email и сохранение пользователя.
Возврат Result<..., DbErr> фиксирует явную модель ошибок для всех реализаций интерфейса.
SeaOrmUserRepository представляет production-реализацию с реальным DatabaseConnection.
MockUserRepository хранит данные в HashMap и подходит для unit-тестов без подключения к СУБД.
Такое разделение через трейт делает бизнес-логику независимой от конкретной ORM и упрощает тестирование.

Этот подход требует дополнительной абстракции, но даёт полный контроль над поведением в тестах.

Интеграционные тесты

Интеграционные тесты запускаются против реальной СУБД. Обычно используется временная база в Docker-контейнере, создаваемая перед тестами и удаляемая после.

Последовательность действий:

Запуск контейнера с PostgreSQL/MySQL через testcontainers crate.
Применение миграций.
Выполнение тестов.
Удаление контейнера.

Пример:

Код ITЗагрузка примера кода…

Разбор:

#[tokio::test] запускает асинхронный тест внутри runtime Tokio, что позволяет использовать await.
clients::Cli::default() создаёт клиент Docker для управления тестовыми контейнерами.
RunnableImage::from(Postgres::default()).with_tag("15") задаёт образ PostgreSQL нужной версии.
docker.run(image) поднимает контейнер перед тестом и предоставляет handle для работы с ним.
get_host_port_ipv4(5432) получает проброшенный порт контейнера, чтобы сформировать корректный URL подключения.
Database::connect(db_url).await.unwrap() подключается к временной базе; после этого обычно запускают миграции и проверяют тестовый сценарий.
Такой подход приближает интеграционные тесты к production-условиям и выявляет проблемы, которые не ловятся моками.

Такой подход гарантирует, что код работает именно так, как в production.

Мониторинг и логирование

Надёжные системы требуют наблюдаемости. При работе с базами данных важны три компонента: логирование, метрики и трассировка.

Логирование

Все SQL-запросы и ошибки должны логироваться. Diesel поддерживает интеграцию с log и tracing. SeaORM позволяет включить логирование через ConnectOptions::log_statements(LogLevel::Debug).

В production логируются:

медленные запросы (например, дольше 100 мс);
ошибки подключения;
откаты транзакций.

Логи структурируются в формате JSON для удобства анализа системами вроде ELK или Loki.

Метрики

С помощью библиотеки metrics или prometheus можно собирать:

количество активных соединений;
время выполнения запросов (гистограммы);
частоту ошибок.

Эти данные позволяют выявлять узкие места и планировать масштабирование.

Трассировка

В распределённых системах запрос проходит через несколько сервисов. Для отслеживания используется OpenTelemetry. SeaORM и современные драйверы совместимы с tracing — каждый запрос может быть помечен тем же trace ID, что и HTTP-запрос, инициировавший его.

Полный жизненный цикл запроса — от HTTP до базы и обратно

Рассмотрим типичный сценарий:

клиент отправляет POST-запрос на /users с JSON-телом;
сервер создаёт пользователя;
возвращает 201 Created.

Получение запроса
Веб-фреймворк (Axum, Actix) принимает HTTP-запрос и извлекает тело.
Десериализация
Тело парсится в структуру CreateUserRequest через serde_json. Если формат неверен — возвращается 400 Bad Request.
Валидация
Поля проверяются на длину, формат email и уникальность (последнее — через запрос к БД).
Создание модели
На основе входных данных строится модель User (SeaORM) или NewUser (Diesel).
Сохранение в базу
Выполняется INSERT внутри транзакции. Если нарушено ограничение уникальности — возвращается 409 Conflict.
Формирование ответа
Созданная запись преобразуется в UserResponse (DTO), сериализуется в JSON.
Отправка ответа
Фреймворк отправляет 201 Created с заголовком Location и телом.

На каждом этапе возможны ошибки, и каждая обрабатывается явно через Result. Благодаря этому система остаётся устойчивой даже при неожиданных сценариях.

Основа по протоколу

Базовый разбор HTTP и HTTPS находится в отдельной статье — HTTP как основа веб-интеграций.

Работа с данными и структурами​

Интерактивная лаборатория​

Обработка структурированных данных — JSON и XML​

Работа с реляционными базами данных (SQL)​

Низкоуровневые драйверы​

ORM — Diesel​

ORM — SeaORM​

Работа с NoSQL-базами данных​

MongoDB​

Redis​

Другие NoSQL-системы​

Выбор подхода​

Транзакции и согласованность данных​

Миграции базы данных​

Diesel и миграции​

SeaORM и миграции​

Пул соединений​

Синхронные пулы​

Асинхронные пулы​

Обработка ошибок​

Сериализация моделей в JSON и обмен данными​

Валидация данных​

Кэширование запросов​

Работа с большими объёмами данных​

Интеграция с веб-фреймворками​

Axum​

Actix Web​

Сравнение производительности — Diesel и SeaORM​

Безопасность при работе с базами данных​

Защита от SQL-инъекций​

Утечки данных​

Ограничение прав доступа​

Хранение учётных данных​

Тестирование слоя данных​

Unit-тесты​

Интеграционные тесты​

Мониторинг и логирование​

Логирование​

Метрики​

Трассировка​

Полный жизненный цикл запроса — от HTTP до базы и обратно​

См. также

История языка Rust

Что требуется знать перед началом изучения языка программирования Rust

Рекомендации по разработке на Rust

Rust для начинающих

Простые приложения на Rust

Основы языка Rust

Экосистема приложений на Rust

Системное программирование на Rust

Синтаксис и пунктуация в Rust

Ключевые слова языка Rust

Встроенные функции и стандартная библиотека

Типы данных и владение памятью

Работа с данными и структурами

Интерактивная лаборатория

Обработка структурированных данных — JSON и XML

Работа с реляционными базами данных (SQL)

Низкоуровневые драйверы

ORM — Diesel

ORM — SeaORM

Работа с NoSQL-базами данных

MongoDB

Redis

Другие NoSQL-системы

Выбор подхода

Транзакции и согласованность данных

Миграции базы данных

Diesel и миграции

SeaORM и миграции

Пул соединений

Синхронные пулы

Асинхронные пулы

Обработка ошибок

Сериализация моделей в JSON и обмен данными

Валидация данных

Кэширование запросов

Работа с большими объёмами данных

Интеграция с веб-фреймворками

Axum

Actix Web

Сравнение производительности — Diesel и SeaORM

Безопасность при работе с базами данных

Защита от SQL-инъекций

Утечки данных

Ограничение прав доступа

Хранение учётных данных

Тестирование слоя данных

Unit-тесты

Интеграционные тесты

Мониторинг и логирование

Логирование

Метрики

Трассировка

Полный жизненный цикл запроса — от HTTP до базы и обратно