Перейти к основному содержимому

7.07. Легальный сбор информации

Разработчику Инженеру

Легальный сбор информации

1. Два лица сбора данных

Сбор информации — фундаментальная активность любой информационной системы, будь то государственный регистр, корпоративная CRM-платформа или персональный дневник в облаке. В цифровой среде процесс трансформировался: объёмы выросли экспоненциально, методы — автоматизировались, а субъекты — множились. Вместе с этим возникла необходимость чётко разделять легальный и нелегальный сбор данных. В предыдущих разделах мы рассматривали преступные практики: взломы, фишинг, скрытую установку вредоносного ПО, промышленный шпионаж — всё то, что нарушает уголовное и административное законодательство.

Однако подавляющая часть собираемой в цифровом пространстве информации — результат легитимных, хотя и не всегда прозрачных, действий. Речь идёт о повседневной практике крупных корпораций, государственных органов, платформ и сервисов, которые собирают данные в рамках установленных правил, но часто — с минимальным осознанием со стороны пользователя.

Важно сразу уточнить: «легальный» не означает «этичный» или «безопасный». Легальность — юридическая категория, определяемая соответствием действий нормам закона. Этика — отдельный пласт, требующий анализа мотивов, последствий и степени информированности субъекта данных.

Эта глава посвящена именно легальному сбору информации: как он устроен, на каких основаниях осуществляется, какие данные собираются и зачем, а также какие механизмы регулируют этот процесс в разных юрисдикциях.


2. Что такое «легальный сбор информации»?

Под легальным сбором информации в контексте цифровых технологий понимается целенаправленное или автоматизированное получение данных о пользователях, устройствах, поведении или контексте с соблюдением действующего законодательства и установленных процедур согласия.

Ключевые элементы этого определения:

  • Целенаправленность или автоматизация: данные могут собираться как в рамках явного запроса (например, регистрация на сайте), так и пассивно — через логирование, куки, трекеры, метрики.
  • Субъект данных — физическое лицо, чьи персональные или поведенческие данные обрабатываются.
  • Согласие — правовой инструмент, с помощью которого субъект данных даёт разрешение на обработку своих данных. Однако согласие — не единственный правовой основание; о других — ниже.
  • Соответствие законодательству — основной критерий легитимности. В разных странах это могут быть GDPR (ЕС), CCPA/CPRA (Калифорния, США), ФЗ-152 (Россия), PIPL (Китай) и др.

Легальный сбор не предполагает «злоупотребления», но допускает максимально широкую интерпретацию интересов бизнеса, если она укладывается в правовое поле. Именно это создаёт ощущение двойственности: действия юридически безупречны, но вызывают дискомфорт у пользователей.


3. Почему компании собирают данные? Экономическая модель внимания

Главная причина легального сбора информации — монетизация поведенческих данных. Современная цифровая экономика построена на так называемой attention economy (экономике внимания): пользовательское внимание становится товаром, который продаётся рекламодателям.

Компании не заинтересованы в личной драме пользователя, его семейных конфликтах или внутренних переживаниях — им важны предсказуемые паттерны поведения, которые позволяют:

  • определить вероятность покупки товара;
  • оценить восприимчивость к рекламному сообщению;
  • классифицировать пользователя по сегментам (демография, интересы, уровень дохода);
  • оптимизировать интерфейсы и функциональность продукта;
  • прогнозировать отток или удержание.

Следовательно, собираемые данные — поведенческие сигналы, а не личные тайны. Это различие принципиально: корпорации не «подслушивают разговоры на кухне» в буквальном смысле (и, как правило, технически не заинтересованы в этом), но инферируют содержание этих разговоров по тому, какие запросы делаются в поисковике, какие страницы просматриваются, какие товары добавляются в корзину, но не покупаются.

Например, если пользователь в течение недели просматривает обзоры детских колясок, посещает форумы молодых родителей и ищет «лучшие роддома в Москве», алгоритмы могут с высокой вероятностью заключить, что он или его супруга находится в состоянии беременности — даже если об этом нигде прямо не сказано. Этот вывод будет использован для таргетирования рекламы подгузников, детского питания или страховых программ.

Таким образом, цель легального сбора — не наблюдение за личностью, а построение предсказательной модели поведения. Модель не требует знания «кто вы», но требует точного понимания «что вы, вероятно, сделаете».


4. Правовые основания для сбора данных

Согласно большинству современных регуляторных режимов (в первую очередь GDPR), обработка персональных данных возможна только при наличии одного из законных оснований:

  1. Согласие субъекта данных — наиболее известное основание. Должно быть свободным, конкретным, информированным и недвусмысленным. Однако на практике «согласие» часто сводится к клику на баннер с куками или галочке «я прочитал пользовательское соглашение», что ставит под сомнение его добровольность.
  2. Исполнение договора — если данные необходимы для предоставления услуги. Например, адрес доставки при заказе товара.
  3. Соблюдение юридической обязанности — например, хранение логов по требованию регулятора.
  4. Защита жизненно важных интересов — редкое основание, применимое в экстренных ситуациях.
  5. Осуществление публичных полномочий — для государственных органов.
  6. Преследование законных интересов контролёра данных — ключевое основание для бизнеса. Именно оно оправдывает сбор аналитических и маркетинговых данных без явного согласия, если интересы компании не превалируют над правами и свободами пользователя.

Последний пункт — наиболее спорный и широко используемый. Например, Google может утверждать, что имеет «законный интерес» в анализе поведения пользователя в Gmail для персонализации рекламы в YouTube, поскольку оба сервиса принадлежат одной экосистеме. Пользователь при этом не давал прямого согласия на такую кросс-сервисную обработку, но она признаётся легальной при соблюдении определённых условий.


5. Технические механизмы легального сбора данных

Легальный сбор информации опирается на целый арсенал технологий, многие из которых являются неотъемлемой частью современной цифровой инфраструктуры. Эти механизмы работают в фоновом режиме, часто без явного ведома пользователя, но их использование регулируется правовыми нормами и (в идеале) контролируется через механизмы согласия.

5.1. Куки (HTTP-куки)

Куки — один из самых старых и распространённых инструментов хранения данных на стороне клиента. Первоначально они были созданы для поддержания состояния сессии (например, авторизации), но быстро превратились в основной инструмент отслеживания поведения.

Существуют два основных типа:

  • Первые куки (first-party cookies) — устанавливаются доменом, который пользователь непосредственно посещает. Используются для функциональности: корзина в интернет-магазине, настройки языка, сохранение сессии.
  • Сторонние куки (third-party cookies) — устанавливаются доменами, отличными от посещаемого сайта. Обычно принадлежат рекламным сетям (Google Ads, Meta Pixel), аналитическим платформам (Google Analytics, Yandex.Metrica) или социальным виджетам.

Хотя сторонние куки всё чаще блокируются браузерами (Safari, Firefox, Chrome с 2024+), они долгое время были основой кросс-сайтового трекинга. При этом их использование признавалось легальным при условии информирования и получения согласия — отсюда повсеместные баннеры с уведомлениями о куки после вступления в силу GDPR.

5.2. Веб-маяки и пиксель-трекеры

Маяки (beacons) — это невидимые 1×1 пиксельные изображения, встроенные в веб-страницы, письма или приложения. При загрузке страницы браузер отправляет HTTP-запрос на сервер, где размещён этот пиксель, и в процессе передаёт метаданные: IP-адрес, User-Agent, время, реферер и идентификаторы сессии.

Пиксель-трекеры (например, Meta Pixel, TikTok Pixel) используются для:

  • подтверждения конверсий (покупка, регистрация);
  • построения ретаргетинговых аудиторий;
  • оценки эффективности рекламных кампаний.

Хотя сам по себе запрос выглядит безобидно, совокупность таких сигналов позволяет точно восстановить поведенческую карту пользователя. Использование таких трекеров считается легальным при условии раскрытия в политике конфиденциальности и получения согласия на маркетинговые цели.

5.3. Device Fingerprinting

Если куки можно удалить, а трекеры — заблокировать, то отпечаток устройства (device fingerprint) формируется на основе характеристик самого устройства и браузера: версия ОС, разрешение экрана, список установленных шрифтов, часовой пояс, поддерживаемые кодеки, WebGL-рендеринг и даже шум микрофона или акселерометра в мобильных устройствах.

Этот метод не требует хранения данных на устройстве — идентификация происходит в реальном времени на сервере. В ЕС и Калифорнии fingerprinting официально признан формой персональных данных, поскольку позволяет однозначно идентифицировать или профилировать пользователя. Следовательно, его использование требует согласия на обработку персональных данных, если применяется для профилирования или таргетинга.

5.4. SDK в мобильных приложениях

В мобильной экосистеме основным инструментом сбора становится Software Development Kit (SDK) — библиотека кода, встраиваемая разработчиком приложения от третьих лиц (Facebook, Adjust, AppsFlyer, Firebase). SDK может собирать:

  • уникальные идентификаторы устройства (IDFA в iOS, GAID в Android);
  • данные о геолокации;
  • информацию о покупках внутри приложения;
  • события взаимодействия (открытие экрана, клики, время сессии).

Apple и Google требуют от разработчиков раскрывать, какие SDK используются и с какой целью. В iOS с внедрением App Tracking Transparency (ATT) в 2021 году сбор IDFA стал возможен только после явного согласия пользователя. Это резко снизило эффективность таргетированной рекламы, но не отменило самого сбора — компании перешли к методам, не зависящим от идентификаторов (например, модели на основе агрегированных данных).

5.5. API-интеграции и обмен данными между сервисами

Крупные платформы (Google, Meta, Microsoft) позволяют сторонним сервисам интегрироваться через API. Например, вход через Google-аккаунт даёт приложению доступ к базовой информации: имени, электронной почте, аватару. Пользователь видит запрос на разрешение, но редко задумывается, что это разрешение — начало легального обмена данными между экосистемами.

Кроме того, сами платформы объединяют данные между своими сервисами. Покупки в Google Play, поиск в Chrome, просмотр видео на YouTube, местоположение в Maps — всё это может использоваться для единой модели пользователя. В рамках GDPR такая внутренняя передача данных оправдывается «законными интересами» и уведомляется в политике конфиденциальности.


6. Согласие как иллюзия контроля

Одна из центральных проблем легального сбора — разрыв между формальным соблюдением закона и реальной осведомлённостью пользователя. Согласие, требуемое регуляторами, на практике превращается в:

  • информационную перегрузку: политики конфиденциальности достигают десятков тысяч слов, написаны юридическим языком и редко читаются.
  • дизайн принуждения (dark patterns): кнопка «Принять всё» выделена ярко, а опции персонализации скрыты за несколькими кликами.
  • отсутствие реального выбора: отказ от согласия часто означает невозможность пользоваться сервисом («всё или ничего»).

В результате пользователь «соглашается», но не понимает, что именно он разрешает и какие последствия это повлечёт. С точки зрения права — это легально. С точки зрения этики и информационной автономии — это системный дефицит.

Тем не менее, именно эта модель — согласие плюс раскрытие — легитимизирует сбор данных в глазах регуляторов. Без неё даже самые безобидные аналитические инструменты становятся нарушением закона.


7. Регуляторные режимы: как законы определяют легальность

Легальность сбора информации напрямую зависит от юрисдикции. Разные правовые системы по-разному балансируют интересы бизнеса, государственного регулирования и прав субъектов данных. Ниже — ключевые модели регулирования.

7.1. GDPR (Общий регламент по защите данных, ЕС)

GDPR (2016/679) — наиболее строгий и влиятельный регуляторный акт в области защиты персональных данных. Он применяется ко всем компаниям, обрабатывающим данные граждан ЕС, независимо от места регистрации.

Ключевые принципы:

  • Целевое ограничение: данные можно собирать только для конкретных, явных и законных целей.
  • Минимизация данных: собирается только то, что необходимо для заявленной цели.
  • Ограничение хранения: данные не могут храниться дольше, чем требуется.
  • Прозрачность: пользователь должен понимать, кто обрабатывает данные, зачем и на каком основании.
  • Право на возражение: пользователь может запретить обработку на основе законных интересов.

GDPR требует активного согласия для маркетинговой обработки и профилирования. Также он вводит обязанность по оценке воздействия на защиту данных (DPIA) при высоких рисках.

7.2. CCPA / CPRA (Калифорния, США)

California Consumer Privacy Act (CCPA), усиленный California Privacy Rights Act (CPRA) с 2023 года, устанавливает права для жителей Калифорнии:

  • Право знать, какие данные собираются и с кем делятся.
  • Право на удаление данных.
  • Право отказаться от «продажи» или «обмена» данных (под «продажей» понимается передача третьим лицам для рекламы).

Важное отличие от GDPR: CCPA не требует согласия на сбор, но даёт право отказаться от его коммерческого использования. Это отражает американский подход — не запрещать сбор, а обеспечивать контроль над его последствиями.

7.3. ФЗ-152 «О персональных данных» (Россия)

Федеральный закон №152-ФЗ регулирует обработку персональных данных на территории РФ. Основные особенности:

  • Обязательное уведомление Роскомнадзора о начале обработки (с 2023 года — только в отдельных случаях).
  • Хранение данных российских граждан на серверах в РФ.
  • Согласие является основным основанием, но допускает исключения (договор, закон).

На практике ФЗ-152 уступает GDPR по строгости: отсутствует прямое право на возражение против профилирования, слабо развита культура DPIA, а санкции применяются выборочно. Тем не менее, формально он создаёт рамки легальности.

7.4. PIPL (Китай), LGPD (Бразилия), PDPA (Сингапур)

Китайский Закон о защите персональной информации (PIPL, 2021) сочетает элементы GDPR и государственного контроля: строгие требования к согласию, обязательная локализация данных и усиленный надзор за кросс-граничной передачей.

Бразильский LGPD во многом вдохновлён GDPR, но с более мягкой системой штрафов.

Сингапурский PDPA делает ставку на саморегуляцию и гибкость, сохраняя баланс между инновациями и защитой.


8. Где заканчивается «законный интерес» и начинается злоупотребление?

Как уже отмечалось, «законный интерес» — наиболее уязвимое основание для легального сбора. Оно позволяет компаниям обрабатывать данные без согласия, если:

  • интерес является реальным и текущим (не гипотетическим);
  • обработка не нарушает основных прав и свобод субъекта данных;
  • достигается разумный баланс между интересами бизнеса и пользователя.

Однако на практике компании часто интерпретируют «законный интерес» чрезмерно широко. Например:

  • использование данных о геолокации для «улучшения сервиса», хотя реальная цель — таргетированная реклама;
  • объединение профилей из разных сервисов под предлогом «единого пользовательского опыта»;
  • сбор данных «на будущее», без чёткой цели.

Регуляторы ЕС уже вынесли ряд решений, ограничивающих такие практики. Например, в 2022 году европейские надзорные органы постановили, что реклама на основе поведенческого профилирования не может основываться на законном интересе — требуется согласие. Это решение существенно сузило пространство для «легального», но непрозрачного сбора.

Таким образом, легальность не статична: даже ранее разрешённые практики могут быть признаны незаконными по результатам разъяснений регуляторов или судебных решений.


9. Саморегуляция индустрии: попытка упорядочить хаос

Поскольку законодательство отстаёт от технологий, индустрия выработала механизмы саморегуляции.

Interactive Advertising Bureau (IAB) Europe разработал TCF — технический и правовой стандарт для управления согласием в цифровой рекламе. Он определяет:

  • как передавать информацию о целях обработки;
  • как фиксировать согласие пользователя;
  • как обмениваться данными между участниками цепочки (издатель → CMP → рекламная сеть).

Однако в 2022 году бельгийский регулятор признал TCF v2.0 нарушающим GDPR, поскольку он поощряет предварительно заполненные согласия и не обеспечивает реальный контроль. Это показывает, что даже отраслевые стандарты не гарантируют легальности.

9.2. Global Privacy Control (GPC)

GPC — технический сигнал (HTTP-заголовок), который пользователь может отправить через браузер или расширение, чтобы выразить желание не продавать или не делиться своими данными. Поддерживается в Калифорнии по закону: сайты обязаны уважать GPC-сигнал. Однако в ЕС его юридическая сила пока не признана.


10. Что может пользователь? Практические меры

Несмотря на системную асимметрию, пользователь не лишён инструментов:

  • Использование приватных браузеров (Brave, Firefox с усиленными настройками) и блокировщиков трекеров (uBlock Origin, Privacy Badger).
  • Отключение таргетированной рекламы через настройки Google, Apple, Meta.
  • Регулярное удаление куки и очистка истории.
  • Использование разных профилей браузера для разных целей (работа, шопинг, личное).
  • Внимательное чтение баннеров согласия и выбор детальных настроек (если доступны).
  • Подача запросов на доступ, исправление или удаление данных по GDPR или CCPA.

Эти меры не остановят сбор полностью, но позволяют снизить объём профилируемых данных и сохранить функциональность критически важных сервисов.