Перейти к основному содержимому

1.15. Текст

Всем

Все мы знаем, что такое текст – связная и полная последовательность символов. Текст для машины – лишь набор сигналов, которые закодированы в файле определенного формата и с определённой кодировкой символов.

Работа с текстовыми файлами – фундаментальный навык в программировании и ИТ. Различные форматы файлов служат разным целям: хранение данных, конфигурация программ, документирование и многое другое. Рассмотрим основные текстовые форматы и их особенности.

Внимание
Приготовьтесь! Страшные слова Текстовые документы – важнейшие в IT. Внимательно ознакомьтесь с тем, как они выглядят. Позднее мы ещё будем погружаться в их особенности.

Основные текстовые форматы

Основные текстовые форматы

TXT (Plain Text) – обычный текстовый файл:

  • простейший формат;
  • нет форматирования;
  • использует кодировки ASCII, UTF-8, Windows-1251 и др.;
  • универсальная читаемость любым текстовым редактором;
  • используется для любых целей – логи, чтение/запись в программах, конфигурациях.

ASCII (American Standard Code for Information Interchange) был создан в 1963 году и стал основной кодировкой для представления текста в виде чисел. С появлением UNIX (1970) текст стал уже частью системы, храня конфигурацию, логи, скрипты. Позже такую же практику переняли MS-DOS, Windows (README, к примеру, был файлом для представления информации о программе).

Практическое задание
Создайте файл txt. Откройте этот файл и добавьте текст. Сохраните файл.

INI – стандартный формат конфигурационных файлов. Используется во многих языках программирования и формируется по структуре:

[Section]
key=value
; Комментарий

Слово «ini» происходит от английского слова «initialization» (инициализация) . Это связано с тем, что файлы с расширением .ini часто использовались для настройки параметров программ и систем на начальном этапе их запуска. Формат INI был создан как простой человекочитаемый текстовый формат , позволяющий легко читать и изменять параметры конфигурации. Наиболее известный пример — файл win.ini, который использовался в ранних версиях Windows (например, Windows 3.1) для хранения системных настроек. Важно отметить, что несмотря на существование INI-файлов, Microsoft перешла к Windows Registry - специальное централизованное хранилище настроек, реестр.

Такой формат состоит из секций (квадратные скобки «[]») и параметров (записываются в виде ключ=значение). Сейчас его можно встретить в разных конфигурациях игр, утилит и простых приложений.

CONFIG (от англ. configuration) — это стандартный формат хранения настроек приложений в экосистеме .NET, разработанный Microsoft как часть платформы .NET Framework в 2002 году, это XML-файл со строго определёнными секциями и элементами, пример:

<configuration>
<appSettings>
<add key="Timeout" value="30" />
</appSettings>
</configuration>

В .NET Core и последующих версиях (.NET 5, 6, 7 и т.д.) появился новый стандарт хранения конфигураций — appsettings.json. Этот формат стал популярным благодаря своей простоте, компактности и широкому использованию в мире REST API, микросервисов и облачных решений.

Файлы без расширения – те, у которых в имени после точки ничего нет. Часто используются для README, LICENCE, .gitignore, .env, а в Unix-системах могут быть исполняемыми. Внутри них может быть что угодно.