3. Данные и разметка - о разделе
О разделе
Вы ещё не забыли, что такое информация и данные? А типы данных? Если забыли, непременно вернитесь и повторите. Сейчас нам придётся заняться ими вплотную.
Вообще, лучше воспользуйтесь содержанием или перейдите к Базе знаний. Но для удобства, я размещу здесь ссылки на основные главы раздела:
Продвинутые операции с данными
- 3.01. Продвинутые операции с данными
- 3.01. Маршалинг и анмаршалинг
- 3.01. Адрес в памяти
- 3.01. Виды битов
- 3.01. Итоги
- 3.01. Чек-лист самопроверки
Продвинутые операции с данными
Структуры данных
Мыслительная база
Конфигурации и данные
Основы баз данных
NoSQL
- 3.06. История NoSQL
- 3.06. Основы NoSQL
- 3.06. Знаки препинания
- 3.06. MongoDB
- 3.06. Справочник по MongoDB
- 3.06. Redis
- 3.06. Справочник по Redis
- 3.06. Cassandra
- 3.06. Справочник по Cassandra
- 3.06. Графовые БД
- 3.06. Справочник по Cypher
- 3.06. Memcached
- 3.06. Справочник по Memcached
- 3.06. NewSQL системы
- 3.06. Векторные базы данных
- 3.06. Итоги
- 3.06. Чек-лист самопроверки
NoSQL
SQL
- 3.07. SQL
- 3.07. Как работает SQL
- 3.07. Как читать сложные SQL запросы
- 3.07. Типы SQL команд
- 3.07. Знаки препинания
- 3.07. Типы данных в SQL
- 3.07. Работа с СУБД
- 3.07. DDL в SQL
- 3.07. Ограничения в SQL
- 3.07. CRUD и DML
- 3.07. Алиасы и объединения
- 3.07. Общие табличные выражения
- 3.07. Другие операции в SQL
- 3.07. Сложные типы
- 3.07. Функции
- 3.07. Транзакции и блокировки
- 3.07. Представления SQL
- 3.07. Процедуры SQL
- 3.07. Оптимизация
- 3.07. Процедурные расширения
- 3.07. Подсказки оптимизатора запросов
- 3.07. Справочник по SQL
- 3.07. Сложные индексы
- 3.07. Шпаргалка с типичными задачами по SQL
- 3.07. Итоги
- 3.07. Чек-лист самопроверки
SQL
Управление РСУБД
HTML
CSS
Анализ данных
Представьте, что человек лишается абсолютно всех своих знаний, информации и данных (воспоминаний, мыслей и прочих признаков мышления), но сохраняет возможность функционировать - он может двигаться, дышать, прыгать. Чем он будет являться без этого? Пустой машиной. Компьютер тоже генерирует сигналы, которые можно направлять для любых мыслимых действий - от обычного включения компьютера до запуска ядерных боеголовок. И чтобы он был не пустым инструментом, он должен генерировать сигналы и манипулировать информацией. И словно человеку для отличия от машины нужны мысли, знания, воспоминания, машине нужны данные.
Этими данными является абсолютно всё, что вы видите вокруг в цифровом мире - тексты, картинки, кнопки, формы, таблицы, настройки, логи, запросы. Данные хранятся, передаются, обрабатываются, структурируются. И вроде бы логично, что кто-то пишет книгу, кто-то её читает, и так же с данными - кто-то их создаёт, кто-то использует.
Воспринимайте всё вокруг как источники данных. Оглянитесь - сколько устройств у вас в доме? Может быть, у вас есть не только смартфон и компьютер, но и смарт-телевизор, умные колонки или смарт-часы? Представьте, что все они собирают данные. Фитнес-браслеты обладают полноценной операционной системой, системой хранения и обработки данных, и собирают на основе непростой логики фиксации сигналов данные о том, сколько человек сделал шагов за день. А потом они подключаются по каналу Bluetooth со смартфоном, передавая ему эти данные, которые уже в дальнейшем переходят в сеть, а компании, обладающие серверами, куда всё отправляется, получают возможность манипулировать этими данными. Миллиарды людей шлют свою информацию на центральные точки аккумуляции данных, где открывается новая возможность - анализ данных.
Если взять те же данные о шагах (всего лишь!), в комбинации с информацией, предоставленной смартфоном (страна проживания, даты, возможно даже пол и прочие личные данные), корпорация получает возможность проанализировать и выяснить, в каких странах чаще ходят, какой пол чаще двигается, и так далее. На основе этой информации более активным людям можно продвигать по районам проживания определенные товары, которые характерны для такой категории. Но это лишь один пример с шагами. А если собирать больше данных?
Теперь задумайтесь - корпорации знают, где и как мы живём, наш режим, вкусы, предпочтения, привычки, наше семейное положение, проблемы, и все данные мы добровольно им дарим своими телефонными разговорами, местоположением, чатам, и прочей, казалось бы, конфиденциальной информацией. И нет, корпорациям плевать на ваши политические взгляды или тайные секреты. Им важнее другое.
Куда вы ходите каждый день? Маршрут дом-работа. А по выходным, допустим, выходите в бар. По пути с работы заглядываете в определенный магазин. Покупаете определенные товары. О вас знают всё. Но этих данных недостаточно, и представим, что таких как вы, тысячи. И все заходят в определённый магазин, который тоже оснащён системой с каталогом товаров, где всё-всё записано в электронных «журналах». Итого, корпорация, владеющая сетью этих магазинов, знает, что в таком-то районе города люди чаще покупают яйца и творог, а в другом районе больше предпочитают алкоголь. И корпорация может манипулировать объёмами поставки на основе автоматического сбора статистики, и больше нужно спрашивать кассиров «ну чё как идут продажи?».
И это лишь минимальный и случайный пример. Если работать с более профессиональным уровнем, касаясь машинного прогнозирования, продвинутого анализа больших данных и т.д., то там и вовсе всё куда круче.
Такова работа с данными. А строится она на единой структуре, принятой во всём мире - типизации и структуризации данных.
Одним из видов данных является код веб-страниц. Это веб-сайты, которые мы ежедневно открываем. Они построены на основе специальной разметки, которая превращает данные в структурированный текст, который понимает браузер, выстраивая красивую страничку.
И здесь мы должны изучить всё, что касается страниц и данных. Нужно понять, как работает SQL, что такое NoSQL, как с ними работать, а также разобраться в основе фронта - HTML и CSS. И лишь после них погрузимся в анализ данных, Big Data, интернет вещей и Data Science.
Для аналитиков. Очень важно хорошо разобраться в данных и научиться извлекать данные при работе с первичным набором информации. В качестве источника может быть много чего - статистика, датасеты, документация, письма от инициаторов, либо вовсе результаты опросов, встреч, интервью. Всё это необходимо уметь собрать, структурировать, разбить по категориям, выстроить связи и логические цепочки, и всё это будет представлять собой анализ. Как в фильмах про детективов, где сначала собирается набор улик и доказательств, которые крепятся на доску, и потом выстраивается связь между ними, после чего, в совокупности, открывается идеальная картина преступления. Это и есть аналитика, которая требует «разобраться», поставить правильные вопросы и получить правильные ответы. Поэтому тема данных очень важна.