Перейти к основному содержимому

Латиница, алфавит и сортировка имён

Всем

Зачем это в IT

В проводнике Windows, в macOS Finder, в списке файлов VS Code и Cursor, в дереве проекта на GitHub имена почти всегда выстроены не «как вам удобно по смыслу», а по правилам сортировки символов. Типичный список в учебной папке выглядит так:

add.py
bear.py
clear.py
double.py
exit.py
function1.py
function2.py
greeting.py
head.py
jeep.py

Порядок кажется случайным, если вы привыкли к русскому алфавиту (А, Б, В…) или к группировке «все function* вместе». На самом деле список уже отсортирован по латинице, буква за буквой. Чтобы не «пролистывать глазами» весь каталог, достаточно один раз выучить порядок A → Z и смотреть на первую букву имени, затем на вторую и так далее.

Ниже — что такое латиница, полная таблица латинского алфавита и как по ней читается сортировка в интерфейсах.


Латиница

Латиница (латинское письмо) — одна из самых распространённых систем письма в мире. Символы, которые вы видите в английских словах, в именах файлов config.json, в адресах сайтов и в коде (def, return, import), как правило записаны латинскими буквами.

Исторически латиница произошла от письма древних римлян и со временем стала основой для многих алфавитов Европы и мира. В IT латиница важна не как «урок истории», а как общий стандарт именования: операционные системы, языки программирования и протоколы десятилетиями опираются на эти 26 букв (плюс цифры и знаки).

Подробнее о письменности как культурном и техническом явлении — в статье «Латиница» в Википедии.

Не путать:

ТерминСмысл
ЛатиницаСистема письма (набор начертаний букв)
Латинский языкЯзык Древнего Рима; сегодня в IT почти не используется для интерфейсов
Английский языкЯзык, который чаще всего пишут латиницей в документации и коде

Русский текст в файловой системе тоже можно встретить, но сортировка русских имён идёт по другому алфавиту (А–Я). В этой статье — только порядок латинских букв, потому что имена модулей, репозиториев и переменных в коде почти всегда на латинице.


Латинский алфавит

В современной английской (и в типичной IT-) записи используют 26 букв. У каждой буквы есть заглавная (большая) и строчная (маленькая) форма. В именах файлов чаще встречаются строчные (readme.md, utils.py), но заглавные тоже бывают (README.md, Dockerfile).

ЗаглавныеСтрочные
Aa
Bb
Cc
Dd
Ee
Ff
Gg
Hh
Ii
Jj
Kk
Ll
Mm
Nn
Oo
Pp
Qq
Rr
Ss
Tt
Uu
Vv
Ww
Xx
Yy
Zz

Порядок букв для сортировки — именно сверху вниз: сначала все имена на A, затем на B, …, в конце на Z. Этот порядок нужно знать наизусть хотя бы в виде «песенки» из детского алфавита: A-B-C-D-E-F-G… — так же, как вы когда-то учили А-Б-В-Г-Д… для кириллицы.

Произношение букв в английских словах — в Ключевые термины и фразы на английском; здесь важен только порядок символов при сравнении имён.


Как читать отсортированный список

Сравнение «словарём»: посимвольно

Сортировка лексикографическая (как в словаре): берутся два имени и сравниваются с первого символа слева направо. Как только в одной позиции буква «меньше» по алфавиту — это имя стоит выше в списке.

Пример из учебной папки:

ИмяПервая букваГде искать в списке
add.pyaВ начале блока на «A»
bear.pybПосле всех на «a», до «c»
clear.pycПосле «b», до «d»
double.pyd
exit.pye
function1.pyfБлок «F» — все function* рядом
greeting.pyg
head.pyh
jeep.pyjПосле «i» (файлов на «i» в примере нет)

Практический приём: не читайте весь список подряд. Спросите себя: «Первая буква моего файла — какая?» Найдите в списке границу между буквами (все c* закончились — начались d*) и сузьте поиск до нескольких строк.

Вторая, третья буква и дальше

Если первые буквы совпадают, сравнение продолжается:

  • clear.py и client.py — оба на c, затем l; на третьей позиции e раньше iclear выше client.
  • function1.py, function2.py, function10.py — общий префикс function. Дальше сравниваются цифры как символы, не как числа: после function1 идёт function10, и только потом function2, потому что символ 1 на общей позиции совпадает, а затем 0 в function10 участвует в сравнении раньше, чем вторая цифра у function2. Это частый источник путаницы; в некоторых программах включают «естественную» сортировку (natural sort), где function2 стоит перед function10, но в простом посимвольном порядке — как в примере выше.

Заглавные и строчные

В разных программах правила чуть отличаются:

  • часто строчные и заглавные одной буквы считаются «одинаковыми» для порядка (регистр не важен);
  • иногда заглавные идут отдельным блоком перед строчными или наоборот.

Поэтому в одной папке могут стоять рядом README.md и readme.md — порядок зависит от настроек ОС или редактора. Для поиска файла полезно помнить: вы могли назвать файл с большой буквы, а смотрите в блок «на m».

Цифры и знаки

Символы, которые не буквы (цифры 0–9, точка ., дефис -, подчёркивание _), имеют свои места в таблице кодов. Часто:

  • имена, начинающиеся с цифры или _, оказываются выше буквенных;
  • точка в имени (расширение .py) на порядок списка не влияет — сравнивают обычно всё имя целиком или имя без расширения, в зависимости от программы.

Если список «ведёт себя странно», проверьте, не включена ли сортировка по дате или по типу — тогда алфавит не используется вообще.


Типичные ошибки новичков

ОшибкаЧто происходитЧто делать
Искать по русскому алфавитубear.py мысленно кладут «после банка», а не после addПереключиться на порядок A–Z
Ждать смысловой группировкиВсе function*.py «должны быть вместе» — они и есть вместе, но между ними порядок по символамСмотреть на буквы после function
Путать числа в имени10 раньше 2 при посимвольной сортировкеПереименовать с ведущими нулями (function02.py) или смириться с порядком
Не заметить режим сортировкиСписок по дате измененияВключить сортировку по имени (Name)
Игнорировать регистрИщете config, а файл Config.pyИспользовать поиск в IDE (Ctrl+P / Quick Open)

Где это встречается каждый день

  • Проводник и Finder — папки проекта, загрузки, рабочий стол.
  • IDE — дерево файлов, список вкладок, автодополнение путей.
  • Git — имена веток и тегов в интерфейсе клиента.
  • Терминал — вывод ls (часто с флагом сортировки).
  • Документация и API — списки методов в справке почти всегда A–Z.

Умение «читать» латинский порядок экономит минуты при каждом открытии проекта; за месяц это часы, которые иначе уходят на бессмысленный просмотр длинных списков.


Кратко

  1. Латиница — письменность, на которой записаны английские имена в IT; порядок букв для сортировки — A → Z.
  2. 26 пар заглавная/строчная — таблица выше; для поиска файла важен порядок букв, не произношение.
  3. Списки в папках упорядочены посимвольно; учебный пример add.pyjeep.py уже отсортирован — нужно знать алфавит, а не «угадывать» расположение.
  4. При совпадении начала имени смотрите следующий символ; цифры и регистр могут менять ожидаемый порядок.

Дальше по разделу: Знаки препинания и символы в IT, Ключевые термины и фразы на английском, Английский язык в IT, Практикум — чтение технической документации.