1.09. Виды информации
Виды информации
Важно отличать вид информации и тип данных.
★ Виды информации:
- текст (набор символов в установленной кодировке);
- графика (матрица пикселей с цветовыми кодами);
- аудио (оцифрованные звуковые волны);
- видео (кадры-графика с аудиодорожкой).
Это всё будут данные, для компьютера будет лишь набор байтов (ибо он общается лишь на язык сигналов), а для нас – информация:
| Данные | Информация |
|---|---|
| Резюме.docx, Файл в формате DOCX | Краткая профессиональная самооценка кандидата на какую-то вакансию, визитная карточка, содержащая информацию о профессиональных достоинствах, квалификации, трудовом опыте. |
| Cat.jpg, Изображение в формате JPG | Фотография моего любимого кота породы мейн-кун, сидящего на кресле и смотрящего прямо в камеру величественным взглядом. |
| Linkin_Park_What_Ive_Done.mp3, Аудиофайл в формате MPEG3 | Отличная песня «What I’ve Done» рок-группы Linkin Park, из альбома Minutes To Midnight. |
| Transformers.avi, Видеофайл в формате AVI | Американский фантастический фильм «Трансформеры» 2007 года, режиссера Майкла Бэя, снятый по мотивам серии игрушек компании Hasbro. |
А теперь погрузимся
Виды информации
В рамках информационных технологий, а также в смежных дисциплинах — таких как теория информации, прикладная лингвистика, когнитивные науки и цифровая семиотика — термин информация часто употребляется в двух смыслах: как субъективное содержание, воспринимаемое человеком, и как объект обработки, представленный в вычислительной системе. Эти два аспекта не следует смешивать, поскольку они принадлежат разным онтологическим уровням.
Компьютер, как физическая машина, оперирует исключительно данными: последовательностями битов, упорядоченных по строго определённым правилам хранения, передачи и интерпретации. Человек же оперирует информацией: осмысленным содержанием, которое получает в результате декодирования и интерпретации этих данных в рамках своего культурного, языкового и когнитивного контекста.
Различие между данными и информацией можно проиллюстрировать следующим образом:
Данные — это структурированное представление, фиксированное в материальном носителе (например, последовательность байтов в файле на диске).
Информация — это семантическая нагрузка, которую человек извлекает из этих данных при условии, что он владеет соответствующим ключом интерпретации: знает язык, понимает формат, обладает контекстом и когнитивной способностью к синтезу смысла.
Это различие принципиально для корректного понимания архитектуры цифровых систем и не должно подменяться поверхностными формулировками вроде «информация — это данные, имеющие смысл». Такая фраза, хотя и интуитивно близка, методологически некорректна: смысл не «присутствует» в данных как их свойство, а возникает в процессе их интерпретации. Следовательно, вопрос о видах информации требует рассмотрения не столько внутреннего устройства данных, сколько природы их семантического проявления — то есть того, каким образом и в каких формах информация может быть закодирована, передана и воспринята.
В этой связи выделяют четыре базовых вида информации, которые соответствуют основным модальностям человеческого восприятия и, соответственно, основным способам её кодирования в цифровой среде:
- текстовая информация — информация, представленная в виде упорядоченной последовательности знаков (символов), образующих единицы языка (фонемы, морфемы, слова, предложения);
- графическая информация — информация, представленная в виде пространственного распределения яркостей и цветов, воспринимаемого визуально как изображение;
- аудиальная информация — информация, представленная в виде временной последовательности звуковых колебаний, воспринимаемой слухом;
- видеоинформация — композитный вид, объединяющий синхронизированные последовательности графических кадров и аудиального сопровождения.
Все эти виды, несмотря на различия в восприятии и обработке, имеют общую черту: они реализуются через цифровое кодирование аналоговых феноменов. Иными словами, каждый из них — результат дискретизации, квантования и последующего представления в бинарной форме того, что в естественной среде существует как непрерывный физический процесс (речь, световые волны, звуковые волны). При этом сама информация сохраняется лишь в той мере, в какой кодирование не приводит к потере семантически значимых характеристик — то есть при условии адекватной разрешающей способности (разрешения, частоты дискретизации, глубины цвета и пр.) и правильного выбора методов сжатия.
Рассмотрим каждый из этих видов подробно, обращая особое внимание на то, как именно он реализуется в цифровой форме, какие стандарты и процессы лежат в его основе, и каким образом данные, соответствующие данному виду, трансформируются в информацию для пользователя.
Текстовая информация
Текстовая информация — наиболее древний и наиболее формализованный способ представления знаний. Её суть заключается в использовании знаковой системы, в которой дискретные элементы (символы) соответствуют фонетическим, морфологическим или синтаксическим единицам естественного или формального языка. В отличие от других видов, текст обладает высокой степенью абстракции: он не имитирует физические параметры реальности напрямую, а кодирует её через условные обозначения, организованные в иерархические структуры (буквы → слова → фразы → абзацы → документы).
Цифровое представление текста требует решения двух задач:
— кодирования символов, то есть установления однозначного соответствия между графемой (например, латинской буквой A, кириллической А, иероглифом 山) и числовым кодом;
— кодирования структуры, то есть представления форматирования, разметки, семантических отношений между частями текста (заголовки, списки, цитаты и т.д.).
Первая задача решается с помощью кодировок — стандартов, определяющих отображение символов в последовательности битов. Исторически первыми были однобайтовые кодировки (ASCII, CP1251, KOI8-R), способные представить не более 256 символов. Их недостаток — принципиальная невозможность охватить все языки мира в едином пространстве. Решением стал стандарт Unicode, предлагающий единое логическое пространство кодовых точек (Code Points), где каждому символу любого известного письма присваивается уникальный номер (например, U+0410 — кириллическая А, U+3042 — японский хирагана あ). При этом для физического хранения Unicode-символов используются различные форматы кодирования: UTF-8 (переменной длины, совместимый с ASCII), UTF-16 (фиксированной или полуфиксированной длины), UTF-32 (фиксированной длины 4 байта).
Вторая задача — представление структуры — решается на более высоком уровне: через языки разметки (HTML, XML, Markdown), бинарные форматы (DOCX, PDF), или программные структуры (DOM-деревья, AST-деревья). Здесь важно понимать, что сам по себе текстовый файл в UTF-8 — это плоская последовательность байтов, не содержащая информации о шрифтах, размерах, полях и пр. Такая метаинформация либо хранится отдельно (в заголовках, стилях, конфигурационных файлах), либо инкапсулируется в составных форматах (например, DOCX — это ZIP-архив, содержащий XML-файлы разметки, стилей, шрифтов и т.д.).
Ключевой особенностью текстовой информации является её обрабатываемость: благодаря дискретности и лингвистической структурированности, текст допускает эффективный поиск, анализ (NLP), синтаксический разбор, машинный перевод, генерацию. Это делает его основным носителем явного знания в цифровых системах — в отличие от графики или аудио, где знание часто остаётся неявным и требует извлечения через сложные алгоритмы (компьютерное зрение, распознавание речи).
Графическая информация
Графическая информация — это кодирование пространственного распределения света, воспринимаемого визуальной системой человека. В аналоговой форме это может быть светочувствительная плёнка, холст с красками, рисунок на бумаге. В цифровой — это дискретная аппроксимация непрерывного светового поля, осуществляемая путём разбиения изображения на элементарные участки — пиксели (picture elements).

Каждый пиксель характеризуется набором числовых параметров, задающих его визуальные свойства. Наиболее распространённые модели:
- RGB (Red, Green, Blue) — аддитивная модель, описывающая цвет как суперпозицию трёх основных цветов света. Каждый компонент обычно представляется 8-битным целым числом (0–255), что даёт 24-битный цвет (≈16,7 млн оттенков).
- RGBA — расширение RGB с альфа-каналом (прозрачность).
- CMYK — субтрактивная модель, используемая в полиграфии (Cyan, Magenta, Yellow, Key/Black).
- HSV/HSL — цилиндрические модели (Hue, Saturation, Value/Lightness), удобные для интерактивного редактирования.
Сами пиксели организуются в растровую матрицу — двумерный массив фиксированного размера (например, 1920×1080). Эта матрица и составляет основу растрового изображения. Альтернативой является векторное представление, где изображение описывается аналитически: как совокупность геометрических примитивов (точек, линий, кривых Безье, фигур) с атрибутами (цвет, толщина, заливка). Векторные форматы (SVG, PDF, AI) масштабируемы без потери качества, но ограничены в передаче фотorealistic-контента.
Важно подчеркнуть: графическое изображение как данные — это не «картинка», а описание состояния светочувствительного сенсора. Например, RAW-файл с цифровой камеры содержит не RGB-значения, а «сырые» показания матрицы (часто с фильтром Байера), требующие сложной постобработки (демозаикирования, баланса белого, гамма-коррекции). Только после этой обработки получается RGB-изображение, интерпретируемое как информация — скажем, фотография кота породы мейн-кун.
Сжатие графики делится на без потерь (PNG, GIF, TIFF LZW) и с потерями (JPEG, WebP, HEIC). Первое сохраняет все исходные данные, второе — устраняет психовизуально избыточную информацию (высокочастотные компоненты, малозначимые цветовые различия), что позволяет добиться высоких коэффициентов сжатия ценой необратимой деградации. Выбор метода зависит от природы контента: текст и логотипы — в PNG, фотографии — в JPEG.
Графическая информация, в отличие от текстовой, не обладает встроенной семантикой: пиксели сами по себе не «говорят», что на них изображено. Семантика возникает лишь при интерпретации — через распознавание объектов (CNN), извлечение текста (OCR), анализ сцен (computer vision). Таким образом, графика — это потенциальный носитель информации, реализуемый только в сочетании с когнитивной или вычислительной системой интерпретации.
Аудиальная информация
Аудиальная информация — это кодирование временных колебаний давления в упругой среде, воспринимаемых слуховой системой как звук. В аналоговой форме звук представляет собой непрерывную функцию амплитуды от времени s(t). Для представления в цифровой системе эта функция подвергается дискретизации и квантованию, в соответствии с теоремой Котельникова–Шеннона: чтобы точно восстановить исходный сигнал, частота дискретизации f_s должна быть не менее чем вдвое выше максимальной частоты f_{\max} в спектре сигнала.
Типичные параметры цифрового аудио:
-
Частота дискретизации (sampling rate):
— 8 кГц — телефонное качество (ограниченный диапазон 300–3400 Гц);
— 44,1 кГц — стандарт CD-аудио (диапазон до 22,05 кГц, покрывающий слышимый человеком спектр ~20 Гц–20 кГц);
— 48 кГц, 96 кГц, 192 кГц — профессиональная и студийная запись (обеспечивают «запас по частоте» для фильтрации и обработки). -
Разрядность (глубина) квантования (bit depth):
— 8 бит — 256 уровней амплитуды, заметный шум квантования;
— 16 бит — 65 536 уровней, динамический диапазон ~96 дБ (стандарт CD);
— 24 бит — 16,7 млн уровней, динамический диапазон ~144 дБ (используется при записи и мастеринге для минимизации накопления ошибок). -
Количество каналов:
— моно (1 канал), стерео (2 канала: L/R), объёмный звук (5.1, 7.1, Dolby Atmos — до 128 объектно-ориентированных аудиодорожек).
В результате этих преобразований непрерывный аналоговый сигнал превращается в последовательность числовых отсчётов — сэмплов — обычно представленных в виде целых (PCM, Pulse Code Modulation) или чисел с плавающей точкой (32-bit float в профессиональных DAW). Эта последовательность и составляет аудиоданные. Однако сами по себе сэмплы — это не «песня», не «речь», не «шум дождя». Это — временной ряд, лишенный семантики.
Семантика возникает только при интерпретации. Например, последовательность сэмплов в файле Linkin_Park_What_Ive_Done.mp3 становится информацией — «рок-песней о раскаянии и искуплении» — лишь тогда, когда:
— слушатель владеет английским языком (для понимания текста);
— обладает культурным контекстом (знаком с жанром ню-метал, с творчеством Linkin Park);
— способен к эмоциональной и когнитивной обработке музыкальных паттернов (ритм, тембр, динамика).
Технически файл .mp3 — это сжатый поток данных, полученный с помощью алгоритма MPEG-1/2 Audio Layer III, который использует психоакустическую модель восприятия для удаления компонентов, малозаметных или неслышимых для человека:
— маскировка по времени (сильный звук «заглушает» слабый в течение ~50 мс до и после);
— маскировка по частоте (сильный тон заглушает соседние частоты);
— ограничение полосы пропускания (срез высоких частот при низких битрейтах).
Таким образом, MP3 — это потеряющая (lossy) форма представления: данные уменьшаются в объёме за счёт удаления информации, считаемой избыточной на уровне восприятия. Однако важно подчеркнуть: информация не исчезает полностью — при достаточном битрейте (≥192 кбит/с) семантическое содержание (мелодия, слова, эмоциональный посыл) сохраняется. Это подтверждает, что информация — не свойство данных, а результат их удачной интерпретации.
Альтернативой являются без потерь форматы: FLAC, ALAC, WAV (с PCM). Они сохраняют все исходные сэмплы, но не добавляют семантики — только полноту данных, необходимую для архивирования или последующей обработки.
Ключевая особенность аудиальной информации — её временная локальность: смысл возникает в динамике, через развитие во времени. Одиночный сэмпл бессмыслен; только последовательность, организованная в ритм, мелодию, фразу, становится носителем информации. Это делает аудио особенно чувствительным к искажениям, задержкам и джиттеру — в отличие от текста или статичной графики, где порядок символов или пикселей фиксирован и устойчив к временным сдвигам.
Видеоинформация
Видеоинформация — это комбинированный вид, объединяющий графическую и аудиальную информацию в единой временной шкале. Формально, видео — это последовательность кадров, каждый из которых представляет собой растровое изображение, сопровождаемое аудиодорожкой, синхронизированной по времени.
Однако в отличие от простого объединения изображения и звука, видео обладает собственной структурой и закономерностями, обусловленными временной избыточностью между кадрами. Например, при съёмке статичной сцены 99 % пикселей остаются неизменными от кадра к кадру. Это позволяет использовать межкадровое сжатие — ключевую технологию современных видеокодеков.
Основные понятия кодирования видео:
-
Кадр (frame) — одно изображение в последовательности.
-
Частота кадров (frame rate) — количество кадров в секунду (fps):
— 24 fps — кинематографический стандарт;
— 25 fps — PAL (Европа, СНГ);
— 29.97/30 fps — NTSC (США, Япония);
— 50/60 fps — для плавного движения (спортивные трансляции, игры). -
Типы кадров:
— I-кадр (Intra-coded) — сжат внутри себя, как отдельное изображение (аналог JPEG); служит точкой доступа;
— P-кадр (Predictive) — кодируется как разность относительно предыдущего I- или P-кадра;
— B-кадр (Bidirectional) — использует предсказание как из прошлого, так и из будущего (требует буферизации); обеспечивает наивысшую степень сжатия.
Цикл из I-кадра и последующих P/B-кадров называется GOP (Group of Pictures). GOP определяет баланс между степенью сжатия и возможностью случайного доступа (seek) — чем длиннее GOP, тем эффективнее сжатие, но тем сложнее начать воспроизведение с произвольного места.
Стандарты видеокодирования развиваются в стороне всё более сложных моделей предсказания:
— MPEG-2 (DVD, цифровое ТВ);
— H.264/AVC (широкое применение: YouTube, Blu-ray, видеоконференции);
— H.265/HEVC (вдвое выше эффективность, чем H.264);
— AV1 (открытый формат, разработанный Alliance for Open Media);
— VVC (H.266), EVC — новые поколения, ориентированные на 4K/8K и VR.
Формат контейнера (например, .avi, .mp4, .mkv) — это упаковка, содержащая:
— видеопоток (в кодированном виде: H.264, VP9 и т.д.);
— один или несколько аудиопотоков (AAC, MP3, Opus);
— метаданные (тайминги, язык, субтитры, геотеги);
— иногда — дополнительные дорожки (субтитры в формате SRT/ASS, главы, альтернативные углы съёмки).
Важно разделять:
— кодек — алгоритм кодирования/декодирования (H.264 — кодек);
— контейнер — формат хранения и синхронизации потоков (.mp4 — контейнер, способный нести H.264 + AAC).
Теперь рассмотрим пример: файл Transformers.avi.
Физически — это последовательность байтов, организованная по спецификации AVI (Audio Video Interleave), разработанной Microsoft в 1992 году. AVI использует RIFF-структуру (Resource Interchange File Format), где данные разбиты на чанки: hdrl (заголовок), strl (потоки), movi (медиаданные), idx1 (индекс). Само видео, скорее всего, закодировано посредством кодека DivX или Xvid (MPEG-4 Part 2), аудио — в MP3 или AC3.
Но информация — «американский фантастический фильм „Трансформеры“ 2007 года…» — возникает только при декодировании и воспроизведении:
— видеопоток → последовательность кадров → зрительная сцена (робот, превращающийся в грузовик);
— аудиопоток → звуковой ряд (музыка Стива Джаблонски, фраза „Autobots, roll out!“);
— синхронизация → ощущение целостного нарратива;
— культурный контекст → узнавание персонажей (Оптимус Прайм, Мегатрон), понимание жанра (научная фантастика, боевик), интерпретация тем (война, преданность, трансформация).
Таким образом, видео — это мультиканальный поток данных, семантическая нагрузка которого реализуется только в процессе интегративного восприятия: зрительной, слуховой, эмоциональной и когнитивной системами одновременно. Это делает видео наиболее «плотным» по информационному содержанию видом — но и наиболее требовательным к ресурсам обработки, хранения и передачи.
Обобщающая характеристика: данные vs информация — повторение с углублением
Вернёмся к таблице из тезиса, но теперь с учётом развёрнутого анализа:
| Данные | Информация |
|---|---|
Резюме.docx — бинарный объект, соответствующий спецификации Office Open XML (ECMA-376): ZIP-архив, содержащий XML-файлы (document.xml, styles.xml, settings.xml), ресурсы (изображения, шрифты), отношения (relationships). Структура строго регламентирована, валидируется схемами XSD. | Краткая профессиональная самооценка… — семантический конструкт, возникающий у рекрутера при чтении документа. Требует владения языком, понимания профессиональной терминологии, способности к оценке компетенций по косвенным признакам (структура, стиль, конкретика формулировок). |
Cat.jpg — поток байтов, соответствующий формату JPEG (ISO/IEC 10918-1): заголовки (SOI, APP0, DQT, SOF0, DHT, SOS), сжатые коэффициенты ДКП (дискретного косинусного преобразования), таблицы Хаффмана. Восстановление изображения требует обратного ДКП и построчного декодирования. | Фотография моего любимого кота… — личностно значимый образ, активирующий эмоциональные и мемориальные связи. Семантика включает не только визуальное распознавание (мейн-кун, кресло, взгляд), но и оценку («величественный»), что выходит за рамки компьютерного зрения. |
Linkin_Park_What_Ive_Done.mp3 — поток MPEG-1/2 Layer III: заголовки фреймов, бит-поток с кодированными масками, коэффициентами MDCT, side information. Воспроизведение требует синтеза через обратное MDCT и применения оконных функций. | Отличная песня… — культурно-эмоциональный артефакт. «Отличная» — субъективная оценка, опирающаяся на музыкальный вкус, личный опыт, ассоциации. Информация включает не только звучание, но и значение: текст как исповедь, музыка как выражение внутреннего конфликта. |
Transformers.avi — RIFF-контейнер, содержащий видеопоток (MPEG-4 ASP), аудиопоток (AC3), индекс смещений. Воспроизведение требует синхронизации clock reference’ов, буферизации, декодирования кадровых типов. | Американский фантастический фильм… — нарративная структура, включающая сюжет, персонажей, визуальный стиль, идеи. Понимание требует знакомства с жанром, мифологией Transformers, кинематографическими конвенциями (монтаж, ракурсы, музыкальное сопровождение как эмоциональный акцент). |
Эти примеры демонстрируют:
- Данные — объективны, измеримы, стандартизированы, воспроизводимы.
- Информация — субъективна, контекстуальна, интерпретируема, зависима от получателя.
Компьютерная система, как таковая, не производит информации. Она только сохраняет, преобразует, передаёт данные. Информация возникает на границе системы и пользователя — в момент интерпретации. Это фундаментальный принцип, определяющий архитектуру всех цифровых сред: от файловых систем до ИИ. Даже самые продвинутые модели (LLM, diffusion models) генерируют данные, имитирующие статистические паттерны обучающих выборок; их превращение в информацию — задача человека.
Немодальные формы информации
Термин немодальные здесь употребляется условно: речь идёт не о «немодальности» как отрицании сенсорной природы, а о формах информации, которые не представлены в стандартных цифровых носителях как первичные данные, либо представлены фрагментарно, либо требуют специализированных интерфейсов для кодирования и воспроизведения. Эти формы соответствуют дополнительным каналам человеческого восприятия, активно задействованным в естественной среде, но слабо интегрированным в повседневные ИТ-системы.
К таким каналам относятся:
1. Тактильная (гаптическая) информация
Тактильная информация — это данные о механическом воздействии на кожу и мышечно-суставный аппарат: давление, вибрация, сдвиг, температура, текстура. В отличие от зрительного или слухового канала, тактильное восприятие локально-дистантно: оно требует физического контакта и чувствительно к пространственному градиенту (разнице давления на соседних рецепторах).
В цифровой среде тактильная информация реализуется через гаптические устройства:
— вибромоторы в смартфонах и геймпадах (одночастотная вибрация — примитивная тактильная обратная связь);
— линейные резонансные актуаторы (LRA) — позволяют формировать импульсы заданной формы и длительности;
— force-feedback устройства (рули, джойстики) — создают сопротивление, имитирующее физическую силу;
— тактильные дисплеи (например, для слепых) — массив микродвигателей, формирующих рельефные точки по стандарту Брайля или свободные тактильные изображения.
Однако ключевая проблема: отсутствие универсального формата тактильного контента. В отличие от RGB для изображений или PCM для звука, для гаптики нет стандартизированной модели представления «тактильного сигнала». Тактильные эффекты обычно задаются процедурно:
— vibrate(50ms, amplitude=0.7);
— apply_force(axis=X, value=-2.3N);
— render_texture('rough_stone', area=[x1,y1,x2,y2]).
Ещё сложнее — кодирование текстуры. Попытки использовать спектральный анализ вибрационных паттернов (аналогично аудио) или параметризованные модели (трение, жёсткость, вязкость — как в модели Dahl или LuGre) остаются в области исследований. В 2023 году был предложен формат OpenHaptics Description Language (OHDL) — на основе JSON-описаний тактильных примитивов, но широкого внедрения он не получил.
Семантически тактильная информация часто модулирует другие виды:
— вибрация при ошибке ввода текста усиливает восприятие «неправильности»;
— сопротивление «виртуального упора» в CAD-интерфейсе помогает точнее позиционировать деталь;
— имитация натяжения струны в VR-инструменте делает игру на гитаре более правдоподобной.
Тем не менее, самостоятельная тактильная информация (например, чтение текста на тактильном дисплее) остаётся узкоспециализированной — из-за низкой пропускной способности канала (человек распознаёт ~10–15 тактильных событий в секунду против ~30 кадров/с для зрения).
2. Обонятельная и гастрономическая информация
Обоняние и вкус — хеморецепторные системы, реагирующие на концентрацию и структуру молекул в воздухе или растворе. В отличие от света или звука, химические сигналы не являются волновыми процессами, а представляют собой дискретные молекулярные события, что принципиально затрудняет их цифровое кодирование.
Существуют проекты «цифрового запаха» (digital scent technology):
— Scentee (2013) — картридж с 10 ароматами, подключаемый к смартфону через аудиоразъём (управление — посредством звукового сигнала);
— oPhone — устройство для передачи «ароматических MIDI-сообщений» («ноты запаха» — базовые компоненты: цветочный, древесный, цитрусовый и т.д.);
— Aroma Shooter — 6-канальный распылитель с быстрым переключением.
Но ни один из них не достиг стандартизации. Причина — в самой природе обоняния:
— у человека ~400 типов обонятельных рецепторов, но восприятие запаха нелинейно и зависит от концентрации, смеси, адаптации;
— не существует «базиса запахов», аналогичного RGB. Попытки выделить 7–10 «первичных запахов» (эфирный, камфорный, мускусный и др.) не подтверждены нейрофизиологически;
— запахи обладают сильной ассоциативной и эмоциональной нагрузкой, но слабой дескриптивной способностью: мы не можем «записать» запах словами так же точно, как изображение — пикселями.
Гастрономическая информация (вкус, послевкусие, консистенция, температура) ещё сложнее: она включает не только хеморецепцию (сладкое, солёное, кислое, горькое, умами), но и механорецепцию (хруст, вязкость), терморецепцию (горячее/холодное), хеместезис (острота перца, прохлада мяты). Ни один цифровой интерфейс не способен воспроизвести её в полноте. Исследования в области гастроскопии (например, проект Virtual Cocktail от NTT) используют электростимуляцию языка для имитации кислого или солёного — но это лишь грубая аппроксимация.
Таким образом, обонятельная и гастрономическая информация в цифровой среде остаются потенциальными видами, реализуемыми только в узких лабораторных или коммерческих нишах (VR-тренажёры для пожарных, симуляторы дегустации). Их данные — это управляющие сигналы для испарителей или электродов; информация — субъективное ощущение, возникающее при физическом контакте с веществом.
3. Вестибулярная и проприоцептивная информация
Эти каналы обеспечивают восприятие положения тела в пространстве, ускорения, гравитации. В цифровых системах они моделируются косвенно:
— через визуальное движение (симуляция полёта в VR);
— через гаптику (вибрация при «ударе», наклон сиденья в симуляторе);
— через инерциальные сенсоры (IMU в шлемах VR — для отслеживания ориентации головы).
Однако прямой код «вестибулярного сигнала» не существует: человеческий вестибулярный аппарат реагирует на угловые и линейные ускорения, которые нельзя передать по каналу связи без физического перемещения. Поэтому при несоответствии визуального и вестибулярного сигнала возникает кинематоз (motion sickness) — фундаментальное ограничение для полностью погружённых VR/AR-сред.
Метаинформация
Метаинформация — это информация о данных, предназначенная для управления их интерпретацией, обработкой, поиском и управлением жизненным циклом. В отличие от основных видов, метаинформация не направлена на прямое восприятие пользователем; её потребитель — как правило, программное обеспечение (ОС, приложения, поисковые системы, архивы), либо человек-специалист (библиотекарь, архивист, инженер).
Ключевое свойство метаинформации — опосредованность: она не содержит семантики первичного контента, но позволяет её извлечь.
Уровни метаинформации
-
Техническая метаинформация — описывает структуру и параметры данных.
Примеры:
— в JPEG:APP0-сегмент c JFIF-заголовком (версия, плотность пикселей);DQT— таблицы квантования;SOF0— размер изображения, количество компонентов;
— в MP3: заголовок фрейма (версия MPEG, частота дискретизации, битрейт, режим стерео);
— в AVI:strh-чанк — тип потока (video/audio), кодек (fccHandler), частота кадров/сэмплов;strf— формат-специфичные данные (для видео — BITMAPINFOHEADER; для аудио — WAVEFORMATEX).Эта метаинформация обязательна для корректного декодирования. Без неё данные становятся «мёртвым грузом» — последовательностью байтов без ключа интерпретации.
-
Дескриптивная метаинформация — описывает семантическое содержание.
Примеры:
— EXIF (Exchangeable Image File Format) — дата/время съёмки, модель камеры, выдержка, диафрагма, GPS-координаты, ориентация;
— ID3v2 — исполнитель, альбом, трек, жанр, текст песни, обложка альбома (встроенное изображение);
— XMP (Extensible Metadata Platform) — расширяемая XML-структура, встраиваемая в PDF, JPEG, TIFF; поддерживает Dublin Core, IPTC, права (Copyright), ключевые слова, история редактирования;
— DOCX: вcore.xml— автор, создание/модификация, категория; вapp.xml— количество страниц, слов, строк.Дескриптивная метаинформация повышает поисковую релевантность и управляемость: файл можно найти по «автору: Тимур» или «GPS: 55.75, 37.62», не открывая его.
-
Административная метаинформация — управляет жизненным циклом и доступом.
Примеры:
— права доступа (ACL в NTFS, POSIX-права в Unix);
— временные метки (ctime, mtime, atime);
— контрольные суммы (MD5, SHA-256 в архивах);
— цифровые подписи и сертификаты (в PDF/A, S/MIME);
— политики хранения (retention policy в ECM-системах: «удалить через 5 лет»). -
Структурная метаинформация — описывает связи между частями составного объекта.
Примеры:
— в PDF: дерево страниц, иерархия закладок, связи в формах (AcroForm);
— в MPEG-TS: PID-метки, таблицы PAT/PMT для мультиплексирования потоков;
— в EPUB:content.opf— манифест ресурсов, spine (порядок чтения), метаданные.
Форматы представления метаинформации
— Встроенные (embedded): хранятся внутри основного файла (EXIF в JPEG, ID3 в MP3). Преимущество — атомарность; недостаток — зависимость от кодека/формата.
— Сопутствующие (sidecar): отдельные файлы (.xmp, .cue для аудио-CD, .srt для субтитров). Гибкость: можно обновлять без перекодирования основного контента.
— Внешние (external): базы данных, индексы (Windows Search Index, Spotlight в macOS, Elasticsearch). Масштабируемость, но риск рассогласования (файл переименован — индекс устарел).
Проблемы и вызовы
— Фрагментация стандартов: EXIF, IPTC, XMP частично дублируют поля («автор» есть везде, но с разными URN).
— Потеря при конвертации: при сохранении JPEG → PNG EXIF теряется, если не скопирован явно.
— Приватность: GPS-координаты в фото могут раскрыть местоположение; метаданные документа — внутреннюю структуру организации.
— Интероперабельность: не все приложения читают XMP; некоторые редакторы «забывают» обновить дату модификации.
Пересечение метаинформации и видов информации
Метаинформация сама может принадлежать определённому виду:
— текстовые поля («название», «автор») — это текстовая информация о данных;
— встроенная обложка альбома в MP3 — графическая информация;
— анализ акустических отпечатков (audio fingerprinting) — извлечение аудиоинформации для идентификации трека.
Таким образом, метаинформация не образует отдельного вида, а надстраивается над базовыми модальностями, создавая семантический каркас, без которого данные остаются «немыми».