Перейти к основному содержимому

Виды информации

Всем

Виды информации

Важно отличать вид информации (по смыслу и признаку классификации) и тип данных в программе (string, int, byte[]).

Play ITЗагрузка интерактивного демо…

В школьном курсе и в этой статье информацию делят по четырём признакам. Один файл может попадать сразу в несколько граф — MP3-файл с лекцией: аудиальная (восприятие), звуковая (форма), специальная (для студентов курса), истинная (если лектор не искажает факты).

Теория для курса базовой информатики — краткая сводка; ниже в статье — разбор цифрового кодирования по форме представления.

По способу восприятия

Какой орган чувств получает сигнал:

ВидОпределениеПримеры
ВизуальнаяСведения, воспринимаемые зрениемФото, схема, текст на экране, видеокадр
АудиальнаяСведения, воспринимаемые слухомРечь, музыка, сигнал будильника
ВкусоваяСведения, воспринимаемые вкусовыми рецепторамиСладость яблока, солёность супа
ОбонятельнаяСведения, воспринимаемые обоняниемЗапах дыма, аромат цветов
ТактильнаяСведения, воспринимаемые кожей — давление, температура, текстураВибрация телефона, шершавая поверхность
ВестибулярнаяСведения о положении тела, ускорении и равновесииКачка корабля, вращение в VR-аттракционе
Мышечная (кинестетическая)Сведения о положении и усилии мышц и суставовОщущение нажатой клавиши, сила на руле симулятора

В IT чаще всего кодируют визуальную, аудиальную и тактильную (обратная связь устройств). О вкусовой, обонятельной, вестибулярной и мышечной — в разделе Немодальные формы информации.

По назначению (доступу)

ВидОпределениеПримеры
МассоваяДоступна всем без специального допускаПубличный сайт, телепередача, открытая энциклопедия
СпециальнаяДля специалистов; без подготовки трудно понятьМедицинский протокол, инженерный чертёж, исходный код
СекретнаяДоступ ограничен — гостайна, коммерческая или служебная тайнаДокумент с грифом, закрытая база разработки
ЛичнаяО конкретном человеке, его частной жизниПереписка, дневник, персональные данные

По форме представления

Как сведения записаны — главный признак для кодирования в файле:

ВидОпределениеЦифровые форматы
ТекстоваяПоследовательность знаков (символов) языка.txt, HTML, DOCX, Markdown
ЧисловаяСведения в виде чисел — измерения, расчёты, датыCSV, JSON, ячейки Excel
ГрафическаяИзображение — пиксели или векторные фигурыPNG, JPEG, SVG
ЗвуковаяЗвуковой сигнал во времениWAV, MP3, FLAC, AAC
ВидеоинформацияКадры (графика) + звук, синхронизированные по времениMP4, WebM, AVI

★ Виды по форме представления (кратко):

  • текст — набор символов в установленной кодировке (UTF-8, Unicode);
  • числа — двоичное или десятичное представление величин;
  • графика — матрица пикселей с цветовыми кодами или векторные кривые;
  • звук — оцифрованные звуковые волны (сэмплы);
  • видео — кадры-графика с аудиодорожкой.

Ниже в статье каждый из пяти видов по форме представления разобран подробно — от байтов до кодеков.

По истинности

ВидОпределениеПримеры
ИстиннаяСообщение соответствует фактамПоказания датчика; проверенная справка
ЛожнаяСообщение не соответствует фактамФейк; ошибочный прогноз; намеренная дезинформация

Истинность не путать с достоверностью как свойством в базовой информатике: там же — полнота, актуальность, объективность.


Вид информации — что мы воспринимаем или как записано содержание. Формат файла (DOCX, JPG, MP3) — правила упаковки байтов. Кодек — алгоритм сжатия потока (например, MP3, H.264). Контейнер (AVI, MP4) — "коробка", в которой лежат закодированные дорожки.


Для компьютера всё перечисленное — набор байтов; для человека при известном контексте — информация:

Данные (файл)Информация (смысл для человека)
Резюме.docxКраткая профессиональная самооценка кандидата
Cat.jpgФотография кота на кресле
song.mp3Музыкальная композиция с текстом
movie.aviФильм: сюжет, персонажи, звук

Дальше — подробный разбор

Ниже — углублённый материал — кодировки Unicode, сжатие с потерями и без, видеокодеки.

Для первого прохода достаточно четырёх признаков классификации и таблицы «данные ↔ информация» ниже; углублённый разбор кодирования можно читать выборочно.

Описание файлов "об объекте" — в статье Метаданные.


А теперь погрузимся

Представьте, что вы получили SMS-сообщение. Само сообщение — это последовательность электрических импульсов и радиосигналов, которые ваш телефон превратил в байты. Это данные.

А вот смысл фразы "Я уже на подходе, жди у подъезда!" — это информация. Она возникает в вашем сознании, потому что вы:

  • Знаете язык, на котором написано сообщение.
  • Понимаете, кто "я" (ваш друг).
  • Знаете, где находится "подъезд".

Если бы это сообщение получил человек, не знающий русского языка, он увидел бы только набор символов — данные без информации.


Виды информации

В рамках информационных технологий, а также в смежных дисциплинах — таких как теория информации, прикладная лингвистика, когнитивные науки и цифровая семиотика — термин информация часто употребляется в двух смыслах — как субъективное содержание, воспринимаемое человеком, и как объект обработки, представленный в вычислительной системе. Эти два аспекта не следует смешивать, поскольку они принадлежат разным онтологическим уровням.

Компьютер, как физическая машина, оперирует исключительно данными — последовательностями битов, упорядоченных по строго определённым правилам хранения, передачи и интерпретации. Человек же оперирует информацией: осмысленным содержанием, которое получает в результате декодирования и интерпретации этих данных в рамках своего культурного, языкового и когнитивного контекста.

Различие между данными и информацией можно проиллюстрировать следующим образом:

Данные — это структурированное представление, фиксированное в материальном носителе (например, последовательность байтов в файле на диске).
Информация — это семантическая нагрузка, которую человек извлекает из этих данных при условии, что он владеет соответствующим ключом интерпретации — знает язык, понимает формат, обладает контекстом и когнитивной способностью к синтезу смысла.

Это различие принципиально для корректного понимания архитектуры цифровых систем и не должно подменяться поверхностными формулировками вроде "информация — это данные, имеющие смысл". Такая фраза, хотя и интуитивно близка, методологически некорректна: смысл не "присутствует" в данных как их свойство, а возникает в процессе их интерпретации. Следовательно, вопрос о видах информации требует рассмотрения сколько природы семантического проявления данных — то есть того, каким образом и в каких формах информация может быть закодирована, передана и воспринята.

В этой связи по форме представления выделяют пять базовых видов, которые соответствуют основным способам кодирования в цифровой среде (см. таблицу выше):

  1. текстовая информация — информация, представленная в виде упорядоченной последовательности знаков (символов), образующих единицы языка (фонемы, морфемы, слова, предложения);
  2. числовая информация — сведения, записанные в виде чисел (целых, дробных, дат, измерений), пригодных для расчётов и сравнения;
  3. графическая информация — информация, представленная в виде пространственного распределения яркостей и цветов, воспринимаемого визуально как изображение;
  4. звуковая (аудиальная) информация — информация, представленная в виде временной последовательности звуковых колебаний, воспринимаемой слухом;
  5. видеоинформация — композитный вид, объединяющий синхронизированные последовательности графических кадров и звукового сопровождения.

Все эти виды, несмотря на различия в восприятии и обработке, имеют общую черту: они реализуются через цифровое кодирование аналоговых феноменов. Иными словами, каждый из них — результат дискретизации, квантования и последующего представления в бинарной форме того, что в естественной среде существует как непрерывный физический процесс (речь, световые волны, звуковые волны). При этом сама информация сохраняется лишь в той мере, в какой кодирование не приводит к потере семантически значимых характеристик — то есть при условии адекватной разрешающей способности (разрешения, частоты дискретизации, глубины цвета и пр.) и правильного выбора методов сжатия.

Рассмотрим каждый из этих видов подробно, обращая особое внимание на то, как именно он реализуется в цифровой форме, какие стандарты и процессы лежат в его основе, и каким образом данные, соответствующие данному виду, трансформируются в информацию для пользователя.


Текстовая информация

Текстовая информация — наиболее древний и наиболее формализованный способ представления знаний. Её суть заключается в использовании знаковой системы, в которой дискретные элементы (символы) соответствуют фонетическим, морфологическим или синтаксическим единицам естественного или формального языка. В отличие от других видов, текст обладает высокой степенью абстракции: он кодирует через условные обозначения, организованные в иерархические структуры (буквы → слова → фразы → абзацы → документы).

Цифровое представление текста требует решения двух задач:
кодирования символов, то есть установления однозначного соответствия между графемой (например, латинской буквой A, кириллической А, иероглифом ) и числовым кодом;
кодирования структуры, то есть представления форматирования, разметки, семантических отношений между частями текста (заголовки, списки, цитаты и т.д.).

Первая задача решается с помощью кодировок — стандартов, определяющих отображение символов в последовательности битов. Исторически первыми были однобайтовые кодировки (ASCII, CP1251, KOI8-R), способные представить не более 256 символов. Их недостаток — принципиальная невозможность охватить все языки мира в едином пространстве. Решением стал стандарт Unicode, предлагающий единое логическое пространство кодовых точек (Code Points), где каждому символу любого известного письма присваивается уникальный номер (например, U+0410 — кириллическая А, U+3042 — японский хирагана ). При этом для физического хранения Unicode-символов используются различные форматы кодирования — UTF-8 (переменной длины, совместимый с ASCII), UTF-16 (фиксированной или полуфиксированной длины), UTF-32 (фиксированной длины 4 байта).

Пример: Как компьютер хранит слово "Привет"

  1. Каждая буква имеет свой номер в таблице Unicode:

    • П = U+041F
    • р = U+0440
    • и = U+0438
    • и так далее.
  2. При сохранении файла в кодировке UTF-8 эти номера преобразуются в последовательность байтов. Например, буква П (U+041F) будет записана как два байта: D0 9F в шестнадцатеричной системе.

  3. Если открыть этот же файл в программе, которая не знает о UTF-8 (например, старый Блокнот в Windows), она попытается прочитать эти байты по старой кодировке (CP1251). Вместо П она покажет два символа: Рџ. Это классический пример того, как одни и те же данные дают разную (и бессмысленную) "информацию" при неправильной интерпретации.

Вторая задача — представление структуры — решается на более высоком уровне — через языки разметки (HTML, XML, Markdown), бинарные форматы (DOCX, PDF), или программные структуры (DOM-деревья, AST-деревья). Здесь важно понимать, что сам по себе текстовый файл в UTF-8 — это плоская последовательность байтов, не содержащая информации о шрифтах, размерах, полях и пр. Такая метаинформация либо хранится отдельно (в заголовках, стилях, конфигурационных файлах), либо инкапсулируется в составных форматах (например, DOCX — это ZIP-архив, содержащий XML-файлы разметки, стилей, шрифтов и т.д.).

Ключевой особенностью текстовой информации является её обрабатываемость — благодаря дискретности и лингвистической структурированности, текст допускает эффективный поиск, анализ (NLP), синтаксический разбор, машинный перевод, генерацию. Это делает его основным носителем явного знания в цифровых системах — в отличие от графики или аудио, где знание часто остаётся неявным и требует извлечения через сложные алгоритмы (компьютерное зрение, распознавание речи).


Числовая информация

Числовая информация — сведения, записанные в виде чисел: целых и дробных величин, дат, координат, результатов измерений. В отличие от текста, здесь главный смысл несёт величина, а не последовательность символов слова.

В компьютере числа хранятся в двоичном виде: целые — в форматах вроде int (32 или 64 бита), дробные — в числах с плавающей точкой (float, double). Таблица Excel, столбец CSV, поле age в JSON — всё это числовые данные, которые программа может складывать, сравнивать и строить по ним графики.

Числовая и текстовая информация часто смешиваются в одном файле: в ячейке «2026» может лежать число (для расчётов) или текст (если ввели как строку). От типа зависит, поймёт ли программа «2026 + 1» как 2027 или как ошибку. Подробнее о системах счисления и битах — в статье Данные.


Графическая информация

Графическая информация — это кодирование пространственного распределения света, воспринимаемого визуальной системой человека. В аналоговой форме это может быть светочувствительная плёнка, холст с красками, рисунок на бумаге. В цифровой — это дискретная аппроксимация непрерывного светового поля, осуществляемая путём разбиения изображения на элементарные участки — пиксели (picture elements).

image-2.png

Каждый пиксель характеризуется набором числовых параметров, задающих его визуальные свойства. Наиболее распространённые модели:

  • RGB (Red, Green, Blue) — аддитивная модель, описывающая цвет как суперпозицию трёх основных цветов света. Каждый компонент обычно представляется 8-битным целым числом (0–255), что даёт 24-битный цвет (≈16,7 млн оттенков).
  • RGBA — расширение RGB с альфа-каналом (прозрачность).
  • CMYK — субтрактивная модель, используемая в полиграфии (Cyan, Magenta, Yellow, Key/Black).
  • HSV/HSL — цилиндрические модели (Hue, Saturation, Value/Lightness), удобные для интерактивного редактирования.

Пример: Цвет в CSS (текстовый способ описания графики)

Даже в текстовом формате можно задать графическую информацию. Вот как в веб-странице задаётся красный фон:

.my-element {
background-color: rgb(255, 0, 0); /* Полностью красный, без зелёного и синего */
/* Или так: */
background-color: #FF0000; /* Шестнадцатеричная запись того же цвета */
}

Play ITЗагрузка интерактивного демо…

Здесь rgb(255, 0, 0) — это текстовые данные, которые браузер интерпретирует как команду "заполнить область красным цветом". Для пользователя это становится графической информацией — он видит красный прямоугольник.

Сами пиксели организуются в растровую матрицу — двумерный массив фиксированного размера (например, 1920×1080). Эта матрица и составляет основу растрового изображения. Альтернативой является векторное представление, где изображение описывается аналитически — как совокупность геометрических примитивов (точек, линий, кривых Безье, фигур) с атрибутами (цвет, толщина, заливка). Векторные форматы (SVG, PDF, AI) масштабируемы без потери качества, но ограничены в передаче фотореалистичного контента.

Графическое изображение как данные — это описание состояния светочувствительного сенсора. Например, RAW-файл с цифровой камеры содержит "сырые" показания матрицы (часто с фильтром Байера), требующие сложной постобработки (демозаикирования, баланса белого, гамма-коррекции). Только после этой обработки получается RGB-изображение, интерпретируемое как информация — скажем, фотография кота породы мейн-кун.

Сжатие: с потерями и без

Без потерь (lossless) — из сжатых данных можно восстановить исходные байты (PNG, FLAC).

С потерями (lossy) — удаляется часть деталей, файл меньше, но откат к исходнику невозможен (JPEG, MP3).

Выбор зависит от задачи: логотип и скрин — lossless; фото и музыка для веба — часто lossy.

Сжатие графики делится на без потерь (PNG, GIF, TIFF LZW) и с потерями (JPEG, WebP, HEIC). Первое сохраняет все исходные данные, второе устраняет психовизуально избыточные детали, что даёт меньший файл ценой необратимых изменений. Текст и логотипы — в PNG; фотографии — в JPEG.

Графическая информация, в отличие от текстовой, не обладает встроенной семантикой: пиксели сами по себе не "говорят", что на них изображено. Семантика возникает лишь при интерпретации — через распознавание объектов (CNN), извлечение текста (OCR), анализ сцен (computer vision). Таким образом, графика — это потенциальный носитель информации, реализуемый только в сочетании с когнитивной или вычислительной системой интерпретации.


Аудиальная информация

Аудиальная информация — это кодирование временных колебаний давления в упругой среде, воспринимаемых слуховой системой как звук. В аналоговой форме звук представляет собой непрерывную функцию амплитуды от времени s(t). Для представления в цифровой системе эта функция подвергается дискретизации и квантованию, в соответствии с теоремой Котельникова–Шеннона: чтобы точно восстановить исходный сигнал, частота дискретизации f_s должна быть не менее чем вдвое выше максимальной частоты f_{\max} в спектре сигнала.

image-3.png

Типичные параметры цифрового аудио:

  • Частота дискретизации (sampling rate):
    — 8 кГц — телефонное качество (ограниченный диапазон 300–3400 Гц);
    — 44,1 кГц — стандарт CD-аудио (диапазон до 22,05 кГц, покрывающий слышимый человеком спектр ~20 Гц–20 кГц);
    — 48 кГц, 96 кГц, 192 кГц — профессиональная и студийная запись (обеспечивают "запас по частоте" для фильтрации и обработки).

  • Разрядность (глубина) квантования (bit depth):
    — 8 бит — 256 уровней амплитуды, заметный шум квантования;
    — 16 бит — 65 536 уровней, динамический диапазон ~96 дБ (стандарт CD);
    — 24 бит — 16,7 млн уровней, динамический диапазон ~144 дБ (используется при записи и мастеринге для минимизации накопления ошибок).

  • Количество каналов:
    — моно (1 канал), стерео (2 канала: L/R), объёмный звук (5.1, 7.1, Dolby Atmos — до 128 объектно-ориентированных аудиодорожек).

В результате этих преобразований непрерывный аналоговый сигнал превращается в последовательность числовых отсчётов — сэмплов — обычно представленных в виде целых (PCM, Pulse Code Modulation) или чисел с плавающей точкой (32-bit float в профессиональных DAW). Эта последовательность и составляет аудиоданные. Однако сами по себе сэмплы — это не "песня", не "речь", не "шум дождя". Это — временной ряд, лишенный семантики.

Семантика возникает только при интерпретации. Например, последовательность сэмплов в файле Linkin_Park_What_Ive_Done.mp3 становится информацией — "рок-песней о раскаянии и искуплении" — лишь тогда, когда:
— слушатель владеет английским языком (для понимания текста);
— обладает культурным контекстом (знаком с жанром ню-метал, с творчеством Linkin Park);
— способен к эмоциональной и когнитивной обработке музыкальных паттернов (ритм, тембр, динамика).

Технически файл .mp3 — это сжатый поток данных, полученный с помощью алгоритма MPEG-1/2 Audio Layer III, который использует психоакустическую модель восприятия для удаления компонентов, малозаметных или неслышимых для человека:
— маскировка по времени (сильный звук "заглушает" слабый в течение ~50 мс до и после);
— маскировка по частоте (сильный тон заглушает соседние частоты);
— ограничение полосы пропускания (срез высоких частот при низких битрейтах).

Таким образом, MP3 — это потеряющая (lossy) форма представления: данные уменьшаются в объёме за счёт удаления информации, считаемой избыточной на уровне восприятия. Однако важно подчеркнуть — информация не исчезает полностью — при достаточном битрейте (≥192 кбит/с) семантическое содержание (мелодия, слова, эмоциональный посыл) сохраняется. Это подтверждает, что информация — результат удачной интерпретации данных.

Альтернативой являются без потерь форматы — FLAC, ALAC, WAV (с PCM). Они сохраняют все исходные сэмплы, но не добавляют семантики — только полноту данных, необходимую для архивирования или последующей обработки.

Ключевая особенность аудиальной информации — её временная локальность: смысл возникает в динамике, через развитие во времени. Одиночный сэмпл бессмыслен; только последовательность, организованная в ритм, мелодию, фразу, становится носителем информации. Это делает аудио особенно чувствительным к искажениям, задержкам и джиттеру — в отличие от текста или статичной графики, где порядок символов или пикселей фиксирован и устойчив к временным сдвигам.


Видеоинформация

Видеоинформация — это комбинированный вид, объединяющий графическую и аудиальную информацию в единой временной шкале. Формально, видео — это последовательность кадров, каждый из которых представляет собой растровое изображение, сопровождаемое аудиодорожкой, синхронизированной по времени.

Однако в отличие от простого объединения изображения и звука, видео обладает собственной структурой и закономерностями, обусловленными временной избыточностью между кадрами. Например, при съёмке статичной сцены 99 % пикселей остаются неизменными от кадра к кадру. Это позволяет использовать межкадровое сжатие — ключевую технологию современных видеокодеков.

Основные понятия кодирования видео:

  • Кадр (frame) — одно изображение в последовательности.

  • Частота кадров (frame rate) — количество кадров в секунду (fps):
    — 24 fps — кинематографический стандарт;
    — 25 fps — PAL (Европа, СНГ);
    — 29.97/30 fps — NTSC (США, Япония);
    — 50/60 fps — для плавного движения (спортивные трансляции, игры).

  • Типы кадров:
    I-кадр (Intra-coded) — сжат внутри себя, как отдельное изображение (аналог JPEG); служит точкой доступа;
    P-кадр (Predictive) — кодируется как разность относительно предыдущего I- или P-кадра;
    B-кадр (Bidirectional) — использует предсказание как из прошлого, так и из будущего (требует буферизации); обеспечивает наивысшую степень сжатия.

Цикл из I-кадра и последующих P/B-кадров называется GOP (Group of Pictures). GOP определяет баланс между степенью сжатия и возможностью случайного доступа (seek) — чем длиннее GOP, тем эффективнее сжатие, но тем сложнее начать воспроизведение с произвольного места.

Стандарты видеокодирования развиваются в стороне всё более сложных моделей предсказания:
— MPEG-2 (DVD, цифровое ТВ);
— H.264/AVC (широкое применение — YouTube, Blu-ray, видеоконференции);
— H.265/HEVC (вдвое выше эффективность, чем H.264);
— AV1 (открытый формат, разработанный Alliance for Open Media);
— VVC (H.266), EVC — новые поколения, ориентированные на 4K/8K и VR.

Формат контейнера (например, .avi, .mp4, .mkv) — это упаковка, содержащая:
— видеопоток (в кодированном виде: H.264, VP9 и т.д.);
— один или несколько аудиопотоков (AAC, MP3, Opus);
— метаданные (тайминги, язык, субтитры, геотеги);
— иногда — дополнительные дорожки (субтитры в формате SRT/ASS, главы, альтернативные углы съёмки).

Важно разделять:
кодек — алгоритм кодирования/декодирования (H.264 — кодек);
контейнер — формат хранения и синхронизации потоков (.mp4 — контейнер, способный нести H.264 + AAC).

Теперь рассмотрим пример: файл Transformers.avi.
Физически — это последовательность байтов, организованная по спецификации AVI (Audio Video Interleave), разработанной Microsoft в 1992 году. AVI использует RIFF-структуру (Resource Interchange File Format), где данные разбиты на чанкиhdrl (заголовок), strl (потоки), movi (медиаданные), idx1 (индекс). Само видео, скорее всего, закодировано посредством кодека DivX или Xvid (MPEG-4 Part 2), аудио — в MP3 или AC3.

Но информация — "американский фантастический фильм „Трансформеры“ 2007 года…" — возникает только при декодировании и воспроизведении:
— видеопоток → последовательность кадров → зрительная сцена (робот, превращающийся в грузовик);
— аудиопоток → звуковой ряд (музыка Стива Джаблонски, фраза „Autobots, roll out!“);
— синхронизация → ощущение целостного нарратива;
— культурный контекст → узнавание персонажей (Оптимус Прайм, Мегатрон), понимание жанра (научная фантастика, боевик), интерпретация тем (война, преданность, трансформация).

Таким образом, видео — это мультиканальный поток данных, семантическая нагрузка которого реализуется только в процессе интегративного восприятия — зрительной, слуховой, эмоциональной и когнитивной системами одновременно. Это делает видео наиболее "плотным" по информационному содержанию видом — но и наиболее требовательным к ресурсам обработки, хранения и передачи.


Обобщающая характеристика

Вернёмся к таблице из тезиса, но теперь с учётом развёрнутого анализа:

ДанныеИнформация
Резюме.docx — бинарный объект, соответствующий спецификации Office Open XML (ECMA-376): ZIP-архив, содержащий XML-файлы (document.xml, styles.xml, settings.xml), ресурсы (изображения, шрифты), отношения (relationships). Структура строго регламентирована, валидируется схемами XSD.Краткая профессиональная самооценка… — семантический конструкт, возникающий у рекрутера при чтении документа. Требует владения языком, понимания профессиональной терминологии, способности к оценке компетенций по косвенным признакам (структура, стиль, конкретика формулировок).
Cat.jpg — поток байтов, соответствующий формату JPEG (ISO/IEC 10918-1): заголовки (SOI, APP0, DQT, SOF0, DHT, SOS), сжатые коэффициенты ДКП (дискретного косинусного преобразования), таблицы Хаффмана. Восстановление изображения требует обратного ДКП и построчного декодирования.Фотография моего любимого кота… — личностно значимый образ, активирующий эмоциональные и мемориальные связи. Семантика включает визуальное распознавание (мейн-кун, кресло, взгляд), и оценку ("величественный"), что выходит за рамки компьютерного зрения.
Linkin_Park_What_Ive_Done.mp3 — поток MPEG-1/2 Layer III: заголовки фреймов, бит-поток с кодированными масками, коэффициентами MDCT, side information. Воспроизведение требует синтеза через обратное MDCT и применения оконных функций.Отличная песня… — культурно-эмоциональный артефакт. "Отличная" — субъективная оценка, опирающаяся на музыкальный вкус, личный опыт, ассоциации. Информация включает и значение: текст как исповедь, музыка как выражение внутреннего конфликта.
Transformers.avi — RIFF-контейнер, содержащий видеопоток (MPEG-4 ASP), аудиопоток (AC3), индекс смещений. Воспроизведение требует синхронизации clock reference’ов, буферизации, декодирования кадровых типов.Американский фантастический фильм… — нарративная структура, включающая сюжет, персонажей, визуальный стиль, идеи. Понимание требует знакомства с жанром, мифологией Transformers, кинематографическими конвенциями (монтаж, ракурсы, музыкальное сопровождение как эмоциональный акцент).

Эти примеры демонстрируют:

  • Данные — объективны, измеримы, стандартизированы, воспроизводимы.
  • Информация — субъективна, контекстуальна, интерпретируема, зависима от получателя.

Компьютерная система сохраняет, преобразует и передаёт данные. Осмысленное содержание для человека возникает при интерпретации — когда известны язык, формат и контекст. Нейросети и другие программы тоже выдают в первую очередь данные (текст, изображения); оценка "понятно / уместно / верно" остаётся за человеком или за правилами предметной области.


Немодальные формы информации

Термин немодальные здесь употребляется условно — речь идёт о видах по способу восприятия (вкусовая, обонятельная, тактильная, вестибулярная, мышечная), которые слабо или фрагментарно представлены в стандартных цифровых носителях либо требуют специализированных интерфейсов для кодирования и воспроизведения.

К таким каналам относятся:


1. Тактильная (гаптическая) информация

Тактильная информация — это данные о механическом воздействии на кожу и мышечно-суставный аппарат — давление, вибрация, сдвиг, температура, текстура. В отличие от зрительного или слухового канала, тактильное восприятие локально-дистантно: оно требует физического контакта и чувствительно к пространственному градиенту (разнице давления на соседних рецепторах).

В цифровой среде тактильная информация реализуется через гаптические устройства:
— вибромоторы в смартфонах и геймпадах (одночастотная вибрация — примитивная тактильная обратная связь);
— линейные резонансные актуаторы (LRA) — позволяют формировать импульсы заданной формы и длительности;
force-feedback устройства (рули, джойстики) — создают сопротивление, имитирующее физическую силу;
— тактильные дисплеи (например, для слепых) — массив микродвигателей, формирующих рельефные точки по стандарту Брайля или свободные тактильные изображения.

Однако ключевая проблема: отсутствие универсального формата тактильного контента. В отличие от RGB для изображений или PCM для звука, для гаптики нет стандартизированной модели представления "тактильного сигнала". Тактильные эффекты обычно задаются процедурно:
vibrate(50ms, amplitude=0.7);
apply_force(axis=X, value=-2.3N);
render_texture('rough_stone', area=[x1,y1,x2,y2]).

Ещё сложнее — кодирование текстуры. Попытки использовать спектральный анализ вибрационных паттернов (аналогично аудио) или параметризованные модели (трение, жёсткость, вязкость — как в модели Dahl или LuGre) остаются в области исследований. В 2023 году был предложен формат OpenHaptics Description Language (OHDL) — на основе JSON-описаний тактильных примитивов, но широкого внедрения он не получил.

Семантически тактильная информация часто модулирует другие виды:
— вибрация при ошибке ввода текста усиливает восприятие "неправильности";
— сопротивление "виртуального упора" в CAD-интерфейсе помогает точнее позиционировать деталь;
— имитация натяжения струны в VR-инструменте делает игру на гитаре более правдоподобной.

Тем не менее, самостоятельная тактильная информация (например, чтение текста на тактильном дисплее) остаётся узкоспециализированной — из-за низкой пропускной способности канала (человек распознаёт ~10–15 тактильных событий в секунду против ~30 кадров/с для зрения).


2. Обонятельная и гастрономическая информация

Обоняние и вкус — хеморецепторные системы, реагирующие на концентрацию и структуру молекул в воздухе или растворе. В отличие от света или звука, химические сигналы представляют собой дискретные молекулярные события, что принципиально затрудняет их цифровое кодирование.

Существуют проекты "цифрового запаха" (digital scent technology):
Scentee (2013) — картридж с 10 ароматами, подключаемый к смартфону через аудиоразъём (управление — посредством звукового сигнала);
oPhone — устройство для передачи "ароматических MIDI-сообщений" ("ноты запаха" — базовые компоненты — цветочный, древесный, цитрусовый и т.д.);
Aroma Shooter — 6-канальный распылитель с быстрым переключением.

Но ни один из них не достиг стандартизации. Причина — в самой природе обоняния:
— у человека ~400 типов обонятельных рецепторов, но восприятие запаха нелинейно и зависит от концентрации, смеси, адаптации;
— не существует "базиса запахов", аналогичного RGB. Попытки выделить 7–10 "первичных запахов" (эфирный, камфорный, мускусный и др.) не подтверждены нейрофизиологически;
— запахи обладают сильной ассоциативной и эмоциональной нагрузкой, но слабой дескриптивной способностью: мы не можем "записать" запах словами так же точно, как изображение — пикселями.

Гастрономическая информация (вкус, послевкусие, консистенция, температура) ещё сложнее — она включает не только хеморецепцию (сладкое, солёное, кислое, горькое, умами), но и механорецепцию (хруст, вязкость), терморецепцию (горячее/холодное), хеместезис (острота перца, прохлада мяты). Ни один цифровой интерфейс не способен воспроизвести её в полноте. Исследования в области гастроскопии (например, проект Virtual Cocktail от NTT) используют электростимуляцию языка для имитации кислого или солёного — но это лишь грубая аппроксимация.

Таким образом, обонятельная и гастрономическая информация в цифровой среде остаются потенциальными видами, реализуемыми только в узких лабораторных или коммерческих нишах (VR-тренажёры для пожарных, симуляторы дегустации). Их данные — это управляющие сигналы для испарителей или электродов; информация — субъективное ощущение, возникающее при физическом контакте с веществом.


3. Вестибулярная и мышечная (проприоцептивная) информация

Эти каналы обеспечивают восприятие положения тела в пространстве, ускорения, гравитации (вестибулярная) и положения и напряжения мышц и суставов (мышечная, кинестетическая). В цифровых системах они моделируются косвенно:
— через визуальное движение (симуляция полёта в VR);
— через гаптику (вибрация при "ударе", наклон сиденья в симуляторе);
— через инерциальные сенсоры (IMU в шлемах VR — для отслеживания ориентации головы).

Однако прямой код "вестибулярного сигнала" не существует: человеческий вестибулярный аппарат реагирует на угловые и линейные ускорения, которые нельзя передать по каналу связи без физического перемещения. Поэтому при несоответствии визуального и вестибулярного сигнала возникает кинематоз (motion sickness) — фундаментальное ограничение для полностью погружённых VR/AR-сред.


Метаданные

Метаданные — сведения о файле — размер, дата, автор, GPS, теги в MP3, заголовок в HTML. Без них байты можно прочитать, но сложно искать, сортировать и понимать происхождение. Технические метаданные (разрешение, кодек) нужны декодеру; описательные (ключевые слова, исполнитель) — человеку и поиску.

Подробный разбор стандартов (EXIF, ID3, XMP, Dublin Core), практики и инструментов — в отдельной статье Метаданные.