3. Данные и разметка - о разделе
О разделе
Вы ещё не забыли, что такое информация и данные? А типы данных? Если забыли, непременно вернитесь и повторите. Сейчас нам придётся заняться ими вплотную.
Вообще, лучше воспользуйтесь содержанием или перейдите к Базе знаний. Но для удобства, я размещу здесь ссылки на основные главы раздела:
Продвинутые операции с данными
- 3-01-prodvinutye-operatsii-s-dannymi
- 3.01. Маршалинг и анмаршалинг
- 3.01. Адрес в памяти
- 3.01. Виды битов
- 3.01. Итоги
- 3.01. Чек-лист самопроверки
Структуры данных
- 3-02-struktury-dannyh
- 3.02. История развития структур данных
- 3.02. Геометрические данные
- 3.02. Фундаментальные структуры данных и их реализация
- 3.02. Итоги
- 3.02. Чек-лист самопроверки
Мыслительная база
Не обязательно для старта — углубление в когнитивистику, математику и ТАФЯ. См. о разделе.
- 3.03. Когнитивистика
- 3.03. Ментальные модели
- 3-03-myslitelnaya-baza
- 3.03. Итоги
- 3.03. Чек-лист самопроверки
Математическое программирование
Не обязательно для старта — оптимизация и исследование операций. См. о разделе.
Конфигурации и данные
- 3-04-konfiguratsii-i-dannye в тексте
- 3.04. Текстовые данные
- 3.04. Справочник по эмодзи
- 3.04. Шрифты
- 3.04. XML
- 3.04. Справочник по XML
- 3.04. Справочник по XSLT
- 3.04. JSON
- 3.04. JSONB
- 3.04. YAML
- 3.04. TOML
- 3.04. CSV
- 3.04. Markdown
- 3.04. JSON Schema, OpenAPI и Schema.org
- 3.04. GraphQL
- 3.04. Parquet и ORC
- 3.04. XAML
- 3.04. Итоги
- 3.04. Чек-лист самопроверки
Основы баз данных
- 3.05. Знакомство с базами данных
- 3.05. СУБД
- 3.05. Роль базы данных в организации
- 3.05. Как БД работает с данными
- 3.05. Теория данных
- 3.05. Двенадцать правил Кодда
- 3.05. Entity Relationship
- 3.05. Конкурентный доступ
- 3.05. Восстановление после сбоя
- 3.05. Data Governance
- 3.05. Итоги
- 3.05. Чек-лист самопроверки
NoSQL
- 3.06. История NoSQL
- 3.06. Основы NoSQL
- 3.06. Знаки препинания
- 3.06. MongoDB
- 3.06. Справочник по MongoDB
- 3.06. Redis
- 3.06. Справочник по Redis
- 3.06. Cassandra
- 3.06. Справочник по Cassandra
- 3.06. Графовые БД
- 3.06. Справочник по Cypher
- 3.06. Memcached
- 3.06. Справочник по Memcached
- 3.06. NewSQL системы
- 3.06. Векторные базы данных
- 3.06. Итоги
- 3.06. Чек-лист самопроверки
SQL
- 3-07-sql
- 3.07. Как работает SQL
- 3.07. Как читать сложные SQL запросы
- 3.07. Типы SQL команд
- 3.07. Знаки препинания
- 3.07. Типы данных в SQL
- 3.07. Работа с СУБД
- 3.07. DDL в SQL
- 3.07. Ограничения в SQL
- 3.07. CRUD и DML
- 3.07. Алиасы и объединения
- 3.07. Общие табличные выражения
- 3.07. Другие операции в SQL
- 3.07. Сложные типы
- 3.07. Функции
- 3.07. Транзакции и блокировки
- 3.07. Представления SQL
- 3.07. Процедуры SQL
- 3.07. Оптимизация
- 3.07. Процедурные расширения
- 3.07. Подсказки оптимизатора запросов
- 3.07. Справочник по SQL
- 3.07. Сложные индексы
- 3.07. Шпаргалка с типичными задачами по SQL
- 3.07. Итоги
- 3.07. Чек-лист самопроверки
Управление РСУБД
- 3.08. Управление РСУБД
- 3.08. Администрирование БД в облаке
- 3.08. Справочник по PostgreSQL
- 3.08. Справочник по MySQL
- 3.08. Справочник по Microsoft SQL Server
- 3.08. Справочник по Oracle DB
- 3.08. Итоги
- 3.08. Чек-лист самопроверки
HTML
- 3-09-html
- 3.09. Web Components
- 3.09. Основные теги
- 3.09. Справочник по HTML
- 3.09. Игры на HTML5
- 3.09. Практика
- 3.09. Итоги
- 3.09. Чек-лист самопроверки
CSS
- 3-10-css
- 3.10. Tailwind CSS
- 3.10. Блочная модель и каскадность
- 3.10. Работа с CSS
- 3.10. Flex и Grid
- 3.10. Адаптивность
- 3.10. Знаки препинания
- 3.10. Псевдо-селекторы
- 3.10. Анимации и трансформации
- 3.10. Работа с CSS
- 3.10. Справочник по CSS
- 3.10. Практика
- 3.10. Итоги
- 3.10. Чек-лист самопроверки
Анализ данных
- 3-11-analiz-dannyh
- 3.11. Дата майнинг
- 3.11. Фиксация на цифрах и ложь в статистике
- 3.11. Основы статистики
- 3.11. Итоги
- 3.11. Чек-лист самопроверки
Представьте, что человек лишается абсолютно всех своих знаний, информации и данных (воспоминаний, мыслей и прочих признаков мышления), но сохраняет возможность функционировать - он может двигаться, дышать, прыгать. Чем он будет являться без этого? Пустой машиной. Компьютер тоже генерирует сигналы, которые можно направлять для любых мыслимых действий - от обычного включения компьютера до запуска ядерных боеголовок. И чтобы он был не пустым инструментом, он должен генерировать сигналы и манипулировать информацией. И словно человеку для отличия от машины нужны мысли, знания, воспоминания, машине нужны данные.
Этими данными является абсолютно всё, что вы видите вокруг в цифровом мире - тексты, картинки, кнопки, формы, таблицы, настройки, логи, запросы. Данные хранятся, передаются, обрабатываются, структурируются. И вроде бы логично, что кто-то пишет книгу, кто-то её читает, и так же с данными - кто-то их создаёт, кто-то использует.
Воспринимайте всё вокруг как источники данных. Оглянитесь - сколько устройств у вас в доме? Может быть, у вас есть не только смартфон и компьютер, но и смарт-телевизор, умные колонки или смарт-часы? Представьте, что все они собирают данные. Фитнес-браслеты обладают полноценной операционной системой, системой хранения и обработки данных, и собирают на основе непростой логики фиксации сигналов данные о том, сколько человек сделал шагов за день. А потом они подключаются по каналу Bluetooth со смартфоном, передавая ему эти данные, которые уже в дальнейшем переходят в сеть, а компании, обладающие серверами, куда всё отправляется, получают возможность манипулировать этими данными. Миллиарды людей шлют свою информацию на центральные точки аккумуляции данных, где открывается новая возможность - анализ данных.
Если взять те же данные о шагах (всего лишь!), в комбинации с информацией, предоставленной смартфоном (страна проживания, даты, возможно даже пол и прочие личные данные), корпорация получает возможность проанализировать и выяснить, в каких странах чаще ходят, какой пол чаще двигается, и так далее. На основе этой информации более активным людям можно продвигать по районам проживания определенные товары, которые характерны для такой категории. Но это лишь один пример с шагами. А если собирать больше данных?
Теперь задумайтесь - корпорации знают, где и как мы живём, наш режим, вкусы, предпочтения, привычки, наше семейное положение, проблемы, и все данные мы добровольно им дарим своими телефонными разговорами, местоположением, чатам, и прочей, казалось бы, конфиденциальной информацией. И нет, корпорациям плевать на ваши политические взгляды или тайные секреты. Им важнее другое.
Куда вы ходите каждый день? Маршрут дом-работа. А по выходным, допустим, выходите в бар. По пути с работы заглядываете в определенный магазин. Покупаете определенные товары. О вас знают всё. Но этих данных недостаточно, и представим, что таких как вы, тысячи. И все заходят в определённый магазин, который тоже оснащён системой с каталогом товаров, где всё-всё записано в электронных "журналах". Итого, корпорация, владеющая сетью этих магазинов, знает, что в таком-то районе города люди чаще покупают яйца и творог, а в другом районе больше предпочитают алкоголь. И корпорация может манипулировать объёмами поставки на основе автоматического сбора статистики, и больше нужно спрашивать кассиров "ну чё как идут продажи?".
И это лишь минимальный и случайный пример. Если работать с более профессиональным уровнем, касаясь машинного прогнозирования, продвинутого анализа больших данных и т.д., то там и вовсе всё куда круче.
Такова работа с данными. А строится она на единой структуре, принятой во всём мире - типизации и структуризации данных.
Одним из видов данных является код веб-страниц. Это веб-сайты, которые мы ежедневно открываем. Они построены на основе специальной разметки, которая превращает данные в структурированный текст, который понимает браузер, выстраивая красивую страничку.
И здесь мы должны изучить всё, что касается страниц и данных. Нужно понять, как работает SQL, что такое NoSQL, как с ними работать, а также разобраться в основе фронта - HTML и CSS. И лишь после них погрузимся в анализ данных, Big Data, интернет вещей и Data Science.