Виды информации
Виды информации
Важно отличать вид информации (по смыслу и признаку классификации) и тип данных в программе (string, int, byte[]).
Play ITЗагрузка интерактивного демо…
В школьном курсе и в этой статье информацию делят по четырём признакам. Один файл может попадать сразу в несколько граф — MP3-файл с лекцией: аудиальная (восприятие), звуковая (форма), специальная (для студентов курса), истинная (если лектор не искажает факты).
Теория для курса базовой информатики — краткая сводка; ниже в статье — разбор цифрового кодирования по форме представления.
По способу восприятия
Какой орган чувств получает сигнал:
| Вид | Определение | Примеры |
|---|---|---|
| Визуальная | Сведения, воспринимаемые зрением | Фото, схема, текст на экране, видеокадр |
| Аудиальная | Сведения, воспринимаемые слухом | Речь, музыка, сигнал будильника |
| Вкусовая | Сведения, воспринимаемые вкусовыми рецепторами | Сладость яблока, солёность супа |
| Обонятельная | Сведения, воспринимаемые обонянием | Запах дыма, аромат цветов |
| Тактильная | Сведения, воспринимаемые кожей — давление, температура, текстура | Вибрация телефона, шершавая поверхность |
| Вестибулярная | Сведения о положении тела, ускорении и равновесии | Качка корабля, вращение в VR-аттракционе |
| Мышечная (кинестетическая) | Сведения о положении и усилии мышц и суставов | Ощущение нажатой клавиши, сила на руле симулятора |
В IT чаще всего кодируют визуальную, аудиальную и тактильную (обратная связь устройств). О вкусовой, обонятельной, вестибулярной и мышечной — в разделе Немодальные формы информации.
По назначению (доступу)
| Вид | Определение | Примеры |
|---|---|---|
| Массовая | Доступна всем без специального допуска | Публичный сайт, телепередача, открытая энциклопедия |
| Специальная | Для специалистов; без подготовки трудно понять | Медицинский протокол, инженерный чертёж, исходный код |
| Секретная | Доступ ограничен — гостайна, коммерческая или служебная тайна | Документ с грифом, закрытая база разработки |
| Личная | О конкретном человеке, его частной жизни | Переписка, дневник, персональные данные |
По форме представления
Как сведения записаны — главный признак для кодирования в файле:
| Вид | Определение | Цифровые форматы |
|---|---|---|
| Текстовая | Последовательность знаков (символов) языка | .txt, HTML, DOCX, Markdown |
| Числовая | Сведения в виде чисел — измерения, расчёты, даты | CSV, JSON, ячейки Excel |
| Графическая | Изображение — пиксели или векторные фигуры | PNG, JPEG, SVG |
| Звуковая | Звуковой сигнал во времени | WAV, MP3, FLAC, AAC |
| Видеоинформация | Кадры (графика) + звук, синхронизированные по времени | MP4, WebM, AVI |
★ Виды по форме представления (кратко):
- текст — набор символов в установленной кодировке (UTF-8, Unicode);
- числа — двоичное или десятичное представление величин;
- графика — матрица пикселей с цветовыми кодами или векторные кривые;
- звук — оцифрованные звуковые волны (сэмплы);
- видео — кадры-графика с аудиодорожкой.
Ниже в статье каждый из пяти видов по форме представления разобран подробно — от байтов до кодеков.
По истинности
| Вид | Определение | Примеры |
|---|---|---|
| Истинная | Сообщение соответствует фактам | Показания датчика; проверенная справка |
| Ложная | Сообщение не соответствует фактам | Фейк; ошибочный прогноз; намеренная дезинформация |
Истинность не путать с достоверностью как свойством в базовой информатике: там же — полнота, актуальность, объективность.
Вид информации — что мы воспринимаем или как записано содержание. Формат файла (DOCX, JPG, MP3) — правила упаковки байтов. Кодек — алгоритм сжатия потока (например, MP3, H.264). Контейнер (AVI, MP4) — "коробка", в которой лежат закодированные дорожки.
Для компьютера всё перечисленное — набор байтов; для человека при известном контексте — информация:
| Данные (файл) | Информация (смысл для человека) |
|---|---|
Резюме.docx | Краткая профессиональная самооценка кандидата |
Cat.jpg | Фотография кота на кресле |
song.mp3 | Музыкальная композиция с текстом |
movie.avi | Фильм: сюжет, персонажи, звук |
Ниже — углублённый материал — кодировки Unicode, сжатие с потерями и без, видеокодеки.
Для первого прохода достаточно четырёх признаков классификации и таблицы «данные ↔ информация» ниже; углублённый разбор кодирования можно читать выборочно.
Описание файлов "об объекте" — в статье Метаданные.
А теперь погрузимся
Представьте, что вы получили SMS-сообщение. Само сообщение — это последовательность электрических импульсов и радиосигналов, которые ваш телефон превратил в байты. Это данные.
А вот смысл фразы "Я уже на подходе, жди у подъезда!" — это информация. Она возникает в вашем сознании, потому что вы:
- Знаете язык, на котором написано сообщение.
- Понимаете, кто "я" (ваш друг).
- Знаете, где находится "подъезд".
Если бы это сообщение получил человек, не знающий русского языка, он увидел бы только набор символов — данные без информации.
Виды информации
В рамках информационных технологий, а также в смежных дисциплинах — таких как теория информации, прикладная лингвистика, когнитивные науки и цифровая семиотика — термин информация часто употребляется в двух смыслах — как субъективное содержание, воспринимаемое человеком, и как объект обработки, представленный в вычислительной системе. Эти два аспекта не следует смешивать, поскольку они принадлежат разным онтологическим уровням.
Компьютер, как физическая машина, оперирует исключительно данными — последовательностями битов, упорядоченных по строго определённым правилам хранения, передачи и интерпретации. Человек же оперирует информацией: осмысленным содержанием, которое получает в результате декодирования и интерпретации этих данных в рамках своего культурного, языкового и когнитивного контекста.
Различие между данными и информацией можно проиллюстрировать следующим образом:
Данные — это структурированное представление, фиксированное в материальном носителе (например, последовательность байтов в файле на диске).
Информация — это семантическая нагрузка, которую человек извлекает из этих данных при условии, что он владеет соответствующим ключом интерпретации — знает язык, понимает формат, обладает контекстом и когнитивной способностью к синтезу смысла.
Это различие принципиально для корректного понимания архитектуры цифровых систем и не должно подменяться поверхностными формулировками вроде "информация — это данные, имеющие смысл". Такая фраза, хотя и интуитивно близка, методологически некорректна: смысл не "присутствует" в данных как их свойство, а возникает в процессе их интерпретации. Следовательно, вопрос о видах информации требует рассмотрения сколько природы семантического проявления данных — то есть того, каким образом и в каких формах информация может быть закодирована, передана и воспринята.
В этой связи по форме представления выделяют пять базовых видов, которые соответствуют основным способам кодирования в цифровой среде (см. таблицу выше):
- текстовая информация — информация, представленная в виде упорядоченной последовательности знаков (символов), образующих единицы языка (фонемы, морфемы, слова, предложения);
- числовая информация — сведения, записанные в виде чисел (целых, дробных, дат, измерений), пригодных для расчётов и сравнения;
- графическая информация — информация, представленная в виде пространственного распределения яркостей и цветов, воспринимаемого визуально как изображение;
- звуковая (аудиальная) информация — информация, представленная в виде временной последовательности звуковых колебаний, воспринимаемой слухом;
- видеоинформация — композитный вид, объединяющий синхронизированные последовательности графических кадров и звукового сопровождения.
Все эти виды, несмотря на различия в восприятии и обработке, имеют общую черту: они реализуются через цифровое кодирование аналоговых феноменов. Иными словами, каждый из них — результат дискретизации, квантования и последующего представления в бинарной форме того, что в естественной среде существует как непрерывный физический процесс (речь, световые волны, звуковые волны). При этом сама информация сохраняется лишь в той мере, в какой кодирование не приводит к потере семантически значимых характеристик — то есть при условии адекватной разрешающей способности (разрешения, частоты дискретизации, глубины цвета и пр.) и правильного выбора методов сжатия.
Рассмотрим каждый из этих видов подробно, обращая особое внимание на то, как именно он реализуется в цифровой форме, какие стандарты и процессы лежат в его основе, и каким образом данные, соответствующие данному виду, трансформируются в информацию для пользователя.
Текстовая информация
Текстовая информация — наиболее древний и наиболее формализованный способ представления знаний. Её суть заключается в использовании знаковой системы, в которой дискретные элементы (символы) соответствуют фонетическим, морфологическим или синтаксическим единицам естественного или формального языка. В отличие от других видов, текст обладает высокой степенью абстракции: он кодирует через условные обозначения, организованные в иерархические структуры (буквы → слова → фразы → абзацы → документы).
Цифровое представление текста требует решения двух задач:
— кодирования символов, то есть установления однозначного соответствия между графемой (например, латинской буквой A, кириллической А, иероглифом 山) и числовым кодом;
— кодирования структуры, то есть представления форматирования, разметки, семантических отношений между частями текста (заголовки, списки, цитаты и т.д.).
Первая задача решается с помощью кодировок — стандартов, определяющих отображение символов в последовательности битов. Исторически первыми были однобайтовые кодировки (ASCII, CP1251, KOI8-R), способные представить не более 256 символов. Их недостаток — принципиальная невозможность охватить все языки мира в едином пространстве. Решением стал стандарт Unicode, предлагающий единое логическое пространство кодовых точек (Code Points), где каждому символу любого известного письма присваивается уникальный номер (например, U+0410 — кириллическая А, U+3042 — японский хирагана あ). При этом для физического хранения Unicode-символов используются различные форматы кодирования — UTF-8 (переменной длины, совместимый с ASCII), UTF-16 (фиксированной или полуфиксированной длины), UTF-32 (фиксированной длины 4 байта).
Пример: Как компьютер хранит слово "Привет"
-
Каждая буква имеет свой номер в таблице Unicode:
П= U+041Fр= U+0440и= U+0438- и так далее.
-
При сохранении файла в кодировке UTF-8 эти номера преобразуются в последовательность байтов. Например, буква
П(U+041F) будет записана как два байта:D0 9Fв шестнадцатеричной системе. -
Если открыть этот же файл в программе, которая не знает о UTF-8 (например, старый Блокнот в Windows), она попытается прочитать эти байты по старой кодировке (CP1251). Вместо
Пона покажет два символа:Рџ. Это классический пример того, как одни и те же данные дают разную (и бессмысленную) "информацию" при неправильной интерпретации.
Вторая задача — представление структуры — решается на более высоком уровне — через языки разметки (HTML, XML, Markdown), бинарные форматы (DOCX, PDF), или программные структуры (DOM-деревья, AST-деревья). Здесь важно понимать, что сам по себе текстовый файл в UTF-8 — это плоская последовательность байтов, не содержащая информации о шрифтах, размерах, полях и пр. Такая метаинформация либо хранится отдельно (в заголовках, стилях, конфигурационных файлах), либо инкапсулируется в составных форматах (например, DOCX — это ZIP-архив, содержащий XML-файлы разметки, стилей, шрифтов и т.д.).
Ключевой особенностью текстовой информации является её обрабатываемость — благодаря дискретности и лингвистической структурированности, текст допускает эффективный поиск, анализ (NLP), синтаксический разбор, машинный перевод, генерацию. Это делает его основным носителем явного знания в цифровых системах — в отличие от графики или аудио, где знание часто остаётся неявным и требует извлечения через сложные алгоритмы (компьютерное зрение, распознавание речи).
Числовая информация
Числовая информация — сведения, записанные в виде чисел: целых и дробных величин, дат, координат, результатов измерений. В отличие от текста, здесь главный смысл несёт величина, а не последовательность символов слова.
В компьютере числа хранятся в двоичном виде: целые — в форматах вроде int (32 или 64 бита), дробные — в числах с плавающей точкой (float, double). Таблица Excel, столбец CSV, поле age в JSON — всё это числовые данные, которые программа может складывать, сравнивать и строить по ним графики.
Числовая и текстовая информация часто смешиваются в одном файле: в ячейке «2026» может лежать число (для расчётов) или текст (если ввели как строку). От типа зависит, поймёт ли программа «2026 + 1» как 2027 или как ошибку. Подробнее о системах счисления и битах — в статье Данные.
Графическая информация
Графическая информация — это кодирование пространственного распределения света, воспринимаемого визуальной системой человека. В аналоговой форме это может быть светочувствительная плёнка, холст с красками, рисунок на бумаге. В цифровой — это дискретная аппроксимация непрерывного светового поля, осуществляемая путём разбиения изображения на элементарные участки — пиксели (picture elements).

Каждый пиксель характеризуется набором числовых параметров, задающих его визуальные свойства. Наиболее распространённые модели:
- RGB (Red, Green, Blue) — аддитивная модель, описывающая цвет как суперпозицию трёх основных цветов света. Каждый компонент обычно представляется 8-битным целым числом (0–255), что даёт 24-битный цвет (≈16,7 млн оттенков).
- RGBA — расширение RGB с альфа-каналом (прозрачность).
- CMYK — субтрактивная модель, используемая в полиграфии (Cyan, Magenta, Yellow, Key/Black).
- HSV/HSL — цилиндрические модели (Hue, Saturation, Value/Lightness), удобные для интерактивного редактирования.
Пример: Цвет в CSS (текстовый способ описания графики)
Даже в текстовом формате можно задать графическую информацию. Вот как в веб-странице задаётся красный фон:
.my-element {
background-color: rgb(255, 0, 0); /* Полностью красный, без зелёного и синего */
/* Или так: */
background-color: #FF0000; /* Шестнадцатеричная запись того же цвета */
}
Play ITЗагрузка интерактивного демо…
Здесь rgb(255, 0, 0) — это текстовые данные, которые браузер интерпретирует как команду "заполнить область красным цветом". Для пользователя это становится графической информацией — он видит красный прямоугольник.
Сами пиксели организуются в растровую матрицу — двумерный массив фиксированного размера (например, 1920×1080). Эта матрица и составляет основу растрового изображения. Альтернативой является векторное представление, где изображение описывается аналитически — как совокупность геометрических примитивов (точек, линий, кривых Безье, фигур) с атрибутами (цвет, толщина, заливка). Векторные форматы (SVG, PDF, AI) масштабируемы без потери качества, но ограничены в передаче фотореалистичного контента.
Графическое изображение как данные — это описание состояния светочувствительного сенсора. Например, RAW-файл с цифровой камеры содержит "сырые" показания матрицы (часто с фильтром Байера), требующие сложной постобработки (демозаикирования, баланса белого, гамма-коррекции). Только после этой обработки получается RGB-изображение, интерпретируемое как информация — скажем, фотография кота породы мейн-кун.
Без потерь (lossless) — из сжатых данных можно восстановить исходные байты (PNG, FLAC).
С потерями (lossy) — удаляется часть деталей, файл меньше, но откат к исходнику невозможен (JPEG, MP3).
Выбор зависит от задачи: логотип и скрин — lossless; фото и музыка для веба — часто lossy.
Сжатие графики делится на без потерь (PNG, GIF, TIFF LZW) и с потерями (JPEG, WebP, HEIC). Первое сохраняет все исходные данные, второе устраняет психовизуально избыточные детали, что даёт меньший файл ценой необратимых изменений. Текст и логотипы — в PNG; фотографии — в JPEG.
Графическая информация, в отличие от текстовой, не обладает встроенной семантикой: пиксели сами по себе не "говорят", что на них изображено. Семантика возникает лишь при интерпретации — через распознавание объектов (CNN), извлечение текста (OCR), анализ сцен (computer vision). Таким образом, графика — это потенциальный носитель информации, реализуемый только в сочетании с когнитивной или вычислительной системой интерпретации.
Аудиальная информация
Аудиальная информация — это кодирование временных колебаний давления в упругой среде, воспринимаемых слуховой системой как звук. В аналоговой форме звук представляет собой непрерывную функцию амплитуды от времени s(t). Для представления в цифровой системе эта функция подвергается дискретизации и квантованию, в соответствии с теоремой Котельникова–Шеннона: чтобы точно восстановить исходный сигнал, частота дискретизации f_s должна быть не менее чем вдвое выше максимальной частоты f_{\max} в спектре сигнала.

Типичные параметры цифрового аудио:
-
Частота дискретизации (sampling rate):
— 8 кГц — телефонное качество (ограниченный диапазон 300–3400 Гц);
— 44,1 кГц — стандарт CD-аудио (диапазон до 22,05 кГц, покрывающий слышимый человеком спектр ~20 Гц–20 кГц);
— 48 кГц, 96 кГц, 192 кГц — профессиональная и студийная запись (обеспечивают "запас по частоте" для фильтрации и обработки). -
Разрядность (глубина) квантования (bit depth):
— 8 бит — 256 уровней амплитуды, заметный шум квантования;
— 16 бит — 65 536 уровней, динамический диапазон ~96 дБ (стандарт CD);
— 24 бит — 16,7 млн уровней, динамический диапазон ~144 дБ (используется при записи и мастеринге для минимизации накопления ошибок). -
Количество каналов:
— моно (1 канал), стерео (2 канала: L/R), объёмный звук (5.1, 7.1, Dolby Atmos — до 128 объектно-ориентированных аудиодорожек).
В результате этих преобразований непрерывный аналоговый сигнал превращается в последовательность числовых отсчётов — сэмплов — обычно представленных в виде целых (PCM, Pulse Code Modulation) или чисел с плавающей точкой (32-bit float в профессиональных DAW). Эта последовательность и составляет аудиоданные. Однако сами по себе сэмплы — это не "песня", не "речь", не "шум дождя". Это — временной ряд, лишенный семантики.
Семантика возникает только при интерпретации. Например, последовательность сэмплов в файле Linkin_Park_What_Ive_Done.mp3 становится информацией — "рок-песней о раскаянии и искуплении" — лишь тогда, когда:
— слушатель владеет английским языком (для понимания текста);
— обладает культурным контекстом (знаком с жанром ню-метал, с творчеством Linkin Park);
— способен к эмоциональной и когнитивной обработке музыкальных паттернов (ритм, тембр, динамика).
Технически файл .mp3 — это сжатый поток данных, полученный с помощью алгоритма MPEG-1/2 Audio Layer III, который использует психоакустическую модель восприятия для удаления компонентов, малозаметных или неслышимых для человека:
— маскировка по времени (сильный звук "заглушает" слабый в течение ~50 мс до и после);
— маскировка по частоте (сильный тон заглушает соседние частоты);
— ограничение полосы пропускания (срез высоких частот при низких битрейтах).
Таким образом, MP3 — это потеряющая (lossy) форма представления: данные уменьшаются в объёме за счёт удаления информации, считаемой избыточной на уровне восприятия. Однако важно подчеркнуть — информация не исчезает полностью — при достаточном битрейте (≥192 кбит/с) семантическое содержание (мелодия, слова, эмоциональный посыл) сохраняется. Это подтверждает, что информация — результат удачной интерпретации данных.
Альтернативой являются без потерь форматы — FLAC, ALAC, WAV (с PCM). Они сохраняют все исходные сэмплы, но не добавляют семантики — только полноту данных, необходимую для архивирования или последующей обработки.
Ключевая особенность аудиальной информации — её временная локальность: смысл возникает в динамике, через развитие во времени. Одиночный сэмпл бессмыслен; только последовательность, организованная в ритм, мелодию, фразу, становится носителем информации. Это делает аудио особенно чувствительным к искажениям, задержкам и джиттеру — в отличие от текста или статичной графики, где порядок символов или пикселей фиксирован и устойчив к временным сдвигам.
Видеоинформация
Видеоинформация — это комбинированный вид, объединяющий графическую и аудиальную информацию в единой временной шкале. Формально, видео — это последовательность кадров, каждый из которых представляет собой растровое изображение, сопровождаемое аудиодорожкой, синхронизированной по времени.
Однако в отличие от простого объединения изображения и звука, видео обладает собственной структурой и закономерностями, обусловленными временной избыточностью между кадрами. Например, при съёмке статичной сцены 99 % пикселей остаются неизменными от кадра к кадру. Это позволяет использовать межкадровое сжатие — ключевую технологию современных видеокодеков.
Основные понятия кодирования видео:
-
Кадр (frame) — одно изображение в последовательности.
-
Частота кадров (frame rate) — количество кадров в секунду (fps):
— 24 fps — кинематографический стандарт;
— 25 fps — PAL (Европа, СНГ);
— 29.97/30 fps — NTSC (США, Япония);
— 50/60 fps — для плавного движения (спортивные трансляции, игры). -
Типы кадров:
— I-кадр (Intra-coded) — сжат внутри себя, как отдельное изображение (аналог JPEG); служит точкой доступа;
— P-кадр (Predictive) — кодируется как разность относительно предыдущего I- или P-кадра;
— B-кадр (Bidirectional) — использует предсказание как из прошлого, так и из будущего (требует буферизации); обеспечивает наивысшую степень сжатия.
Цикл из I-кадра и последующих P/B-кадров называется GOP (Group of Pictures). GOP определяет баланс между степенью сжатия и возможностью случайного доступа (seek) — чем длиннее GOP, тем эффективнее сжатие, но тем сложнее начать воспроизведение с произвольного места.
Стандарты видеокодирования развиваются в стороне всё более сложных моделей предсказания:
— MPEG-2 (DVD, цифровое ТВ);
— H.264/AVC (широкое применение — YouTube, Blu-ray, видеоконференции);
— H.265/HEVC (вдвое выше эффективность, чем H.264);
— AV1 (открытый формат, разработанный Alliance for Open Media);
— VVC (H.266), EVC — новые поколения, ориентированные на 4K/8K и VR.
Формат контейнера (например, .avi, .mp4, .mkv) — это упаковка, содержащая:
— видеопоток (в кодированном виде: H.264, VP9 и т.д.);
— один или несколько аудиопотоков (AAC, MP3, Opus);
— метаданные (тайминги, язык, субтитры, геотеги);
— иногда — дополнительные дорожки (субтитры в формате SRT/ASS, главы, альтернативные углы съёмки).
Важно разделять:
— кодек — алгоритм кодирования/декодирования (H.264 — кодек);
— контейнер — формат хранения и синхронизации потоков (.mp4 — контейнер, способный нести H.264 + AAC).
Теперь рассмотрим пример: файл Transformers.avi.
Физически — это последовательность байтов, организованная по спецификации AVI (Audio Video Interleave), разработанной Microsoft в 1992 году. AVI использует RIFF-структуру (Resource Interchange File Format), где данные разбиты на чанки — hdrl (заголовок), strl (потоки), movi (медиаданные), idx1 (индекс). Само видео, скорее всего, закодировано посредством кодека DivX или Xvid (MPEG-4 Part 2), аудио — в MP3 или AC3.
Но информация — "американский фантастический фильм „Трансформеры“ 2007 года…" — возникает только при декодировании и воспроизведении:
— видеопоток → последовательность кадров → зрительная сцена (робот, превращающийся в грузовик);
— аудиопоток → звуковой ряд (музыка Стива Джаблонски, фраза „Autobots, roll out!“);
— синхронизация → ощущение целостного нарратива;
— культурный контекст → узнавание персонажей (Оптимус Прайм, Мегатрон), понимание жанра (научная фантастика, боевик), интерпретация тем (война, преданность, трансформация).
Таким образом, видео — это мультиканальный поток данных, семантическая нагрузка которого реализуется только в процессе интегративного восприятия — зрительной, слуховой, эмоциональной и когнитивной системами одновременно. Это делает видео наиболее "плотным" по информационному содержанию видом — но и наиболее требовательным к ресурсам обработки, хранения и передачи.
Обобщающая характеристика
Вернёмся к таблице из тезиса, но теперь с учётом развёрнутого анализа:
| Данные | Информация |
|---|---|
Резюме.docx — бинарный объект, соответствующий спецификации Office Open XML (ECMA-376): ZIP-архив, содержащий XML-файлы (document.xml, styles.xml, settings.xml), ресурсы (изображения, шрифты), отношения (relationships). Структура строго регламентирована, валидируется схемами XSD. | Краткая профессиональная самооценка… — семантический конструкт, возникающий у рекрутера при чтении документа. Требует владения языком, понимания профессиональной терминологии, способности к оценке компетенций по косвенным признакам (структура, стиль, конкретика формулировок). |
Cat.jpg — поток байтов, соответствующий формату JPEG (ISO/IEC 10918-1): заголовки (SOI, APP0, DQT, SOF0, DHT, SOS), сжатые коэффициенты ДКП (дискретного косинусного преобразования), таблицы Хаффмана. Восстановление изображения требует обратного ДКП и построчного декодирования. | Фотография моего любимого кота… — личностно значимый образ, активирующий эмоциональные и мемориальные связи. Семантика включает визуальное распознавание (мейн-кун, кресло, взгляд), и оценку ("величественный"), что выходит за рамки компьютерного зрения. |
Linkin_Park_What_Ive_Done.mp3 — поток MPEG-1/2 Layer III: заголовки фреймов, бит-поток с кодированными масками, коэффициентами MDCT, side information. Воспроизведение требует синтеза через обратное MDCT и применения оконных функций. | Отличная песня… — культурно-эмоциональный артефакт. "Отличная" — субъективная оценка, опирающаяся на музыкальный вкус, личный опыт, ассоциации. Информация включает и значение: текст как исповедь, музыка как выражение внутреннего конфликта. |
Transformers.avi — RIFF-контейнер, содержащий видеопоток (MPEG-4 ASP), аудиопоток (AC3), индекс смещений. Воспроизведение требует синхронизации clock reference’ов, буферизации, декодирования кадровых типов. | Американский фантастический фильм… — нарративная структура, включающая сюжет, персонажей, визуальный стиль, идеи. Понимание требует знакомства с жанром, мифологией Transformers, кинематографическими конвенциями (монтаж, ракурсы, музыкальное сопровождение как эмоциональный акцент). |
Эти примеры демонстрируют:
- Данные — объективны, измеримы, стандартизированы, воспроизводимы.
- Информация — субъективна, контекстуальна, интерпретируема, зависима от получателя.
Компьютерная система сохраняет, преобразует и передаёт данные. Осмысленное содержание для человека возникает при интерпретации — когда известны язык, формат и контекст. Нейросети и другие программы тоже выдают в первую очередь данные (текст, изображения); оценка "понятно / уместно / верно" остаётся за человеком или за правилами предметной области.
Немодальные формы информации
Термин немодальные здесь употребляется условно — речь идёт о видах по способу восприятия (вкусовая, обонятельная, тактильная, вестибулярная, мышечная), которые слабо или фрагментарно представлены в стандартных цифровых носителях либо требуют специализированных интерфейсов для кодирования и воспроизведения.
К таким каналам относятся:
1. Тактильная (гаптическая) информация
Тактильная информация — это данные о механическом воздействии на кожу и мышечно-суставный аппарат — давление, вибрация, сдвиг, температура, текстура. В отличие от зрительного или слухового канала, тактильное восприятие локально-дистантно: оно требует физического контакта и чувствительно к пространственному градиенту (разнице давления на соседних рецепторах).
В цифровой среде тактильная информация реализуется через гаптические устройства:
— вибромоторы в смартфонах и геймпадах (одночастотная вибрация — примитивная тактильная обратная связь);
— линейные резонансные актуаторы (LRA) — позволяют формировать импульсы заданной формы и длительности;
— force-feedback устройства (рули, джойстики) — создают сопротивление, имитирующее физическую силу;
— тактильные дисплеи (например, для слепых) — массив микродвигателей, формирующих рельефные точки по стандарту Брайля или свободные тактильные изображения.
Однако ключевая проблема: отсутствие универсального формата тактильного контента. В отличие от RGB для изображений или PCM для звука, для гаптики нет стандартизированной модели представления "тактильного сигнала". Тактильные эффекты обычно задаются процедурно:
— vibrate(50ms, amplitude=0.7);
— apply_force(axis=X, value=-2.3N);
— render_texture('rough_stone', area=[x1,y1,x2,y2]).
Ещё сложнее — кодирование текстуры. Попытки использовать спектральный анализ вибрационных паттернов (аналогично аудио) или параметризованные модели (трение, жёсткость, вязкость — как в модели Dahl или LuGre) остаются в области исследований. В 2023 году был предложен формат OpenHaptics Description Language (OHDL) — на основе JSON-описаний тактильных примитивов, но широкого внедрения он не получил.
Семантически тактильная информация часто модулирует другие виды:
— вибрация при ошибке ввода текста усиливает восприятие "неправильности";
— сопротивление "виртуального упора" в CAD-интерфейсе помогает точнее позиционировать деталь;
— имитация натяжения струны в VR-инструменте делает игру на гитаре более правдоподобной.
Тем не менее, самостоятельная тактильная информация (например, чтение текста на тактильном дисплее) остаётся узкоспециализированной — из-за низкой пропускной способности канала (человек распознаёт ~10–15 тактильных событий в секунду против ~30 кадров/с для зрения).
2. Обонятельная и гастрономическая информация
Обоняние и вкус — хеморецепторные системы, реагирующие на концентрацию и структуру молекул в воздухе или растворе. В отличие от света или звука, химические сигналы представляют собой дискретные молекулярные события, что принципиально затрудняет их цифровое кодирование.
Существуют проекты "цифрового запаха" (digital scent technology):
— Scentee (2013) — картридж с 10 ароматами, подключаемый к смартфону через аудиоразъём (управление — посредством звукового сигнала);
— oPhone — устройство для передачи "ароматических MIDI-сообщений" ("ноты запаха" — базовые компоненты — цветочный, древесный, цитрусовый и т.д.);
— Aroma Shooter — 6-канальный распылитель с быстрым переключением.
Но ни один из них не достиг стандартизации. Причина — в самой природе обоняния:
— у человека ~400 типов обонятельных рецепторов, но восприятие запаха нелинейно и зависит от концентрации, смеси, адаптации;
— не существует "базиса запахов", аналогичного RGB. Попытки выделить 7–10 "первичных запахов" (эфирный, камфорный, мускусный и др.) не подтверждены нейрофизиологически;
— запахи обладают сильной ассоциативной и эмоциональной нагрузкой, но слабой дескриптивной способностью: мы не можем "записать" запах словами так же точно, как изображение — пикселями.
Гастрономическая информация (вкус, послевкусие, консистенция, температура) ещё сложнее — она включает не только хеморецепцию (сладкое, солёное, кислое, горькое, умами), но и механорецепцию (хруст, вязкость), терморецепцию (горячее/холодное), хеместезис (острота перца, прохлада мяты). Ни один цифровой интерфейс не способен воспроизвести её в полноте. Исследования в области гастроскопии (например, проект Virtual Cocktail от NTT) используют электростимуляцию языка для имитации кислого или солёного — но это лишь грубая аппроксимация.
Таким образом, обонятельная и гастрономическая информация в цифровой среде остаются потенциальными видами, реализуемыми только в узких лабораторных или коммерческих нишах (VR-тренажёры для пожарных, симуляторы дегустации). Их данные — это управляющие сигналы для испарителей или электродов; информация — субъективное ощущение, возникающее при физическом контакте с веществом.
3. Вестибулярная и мышечная (проприоцептивная) информация
Эти каналы обеспечивают восприятие положения тела в пространстве, ускорения, гравитации (вестибулярная) и положения и напряжения мышц и суставов (мышечная, кинестетическая). В цифровых системах они моделируются косвенно:
— через визуальное движение (симуляция полёта в VR);
— через гаптику (вибрация при "ударе", наклон сиденья в симуляторе);
— через инерциальные сенсоры (IMU в шлемах VR — для отслеживания ориентации головы).
Однако прямой код "вестибулярного сигнала" не существует: человеческий вестибулярный аппарат реагирует на угловые и линейные ускорения, которые нельзя передать по каналу связи без физического перемещения. Поэтому при несоответствии визуального и вестибулярного сигнала возникает кинематоз (motion sickness) — фундаментальное ограничение для полностью погружённых VR/AR-сред.
Метаданные
Метаданные — сведения о файле — размер, дата, автор, GPS, теги в MP3, заголовок в HTML. Без них байты можно прочитать, но сложно искать, сортировать и понимать происхождение. Технические метаданные (разрешение, кодек) нужны декодеру; описательные (ключевые слова, исполнитель) — человеку и поиску.
Подробный разбор стандартов (EXIF, ID3, XMP, Dublin Core), практики и инструментов — в отдельной статье Метаданные.