Валентин Арьков - Бизнес-аналитика. Извлечение, преобразование и загрузка данных

Здесь есть возможность читать онлайн «Валентин Арьков - Бизнес-аналитика. Извлечение, преобразование и загрузка данных» — ознакомительный отрывок электронной книги совершенно бесплатно, а после прочтения отрывка купить полную версию. В некоторых случаях можно слушать аудио, скачать через торрент в формате fb2 и присутствует краткое содержание. Год выпуска: 2020, Жанр: Прочая научная литература, Прочая околокомпьтерная литература, Руководства, popular_business, на русском языке. Описание произведения, (предисловие) а так же отзывы посетителей доступны на портале библиотеки ЛибКат.

Бизнес-аналитика. Извлечение, преобразование и загрузка данных: краткое содержание, описание и аннотация

Предлагаем к чтению аннотацию, описание, краткое содержание или предисловие (зависит от того, что написал сам автор книги «Бизнес-аналитика. Извлечение, преобразование и загрузка данных»). Если вы не нашли необходимую информацию о книге — напишите в комментариях, мы постараемся отыскать её.

Системы бизнес-аналитики работают с различными источниками данных с помощью функций ETL (Extract-Transform-Load). Название ETL можно перевести как «извлечение, преобразование и загрузка данных». Имеется в виду загрузка в хранилище данных для дальнейшей обработки в системе бизнес-аналитики.
В простейшем случае это загрузка данных в виде одной, объединённой, консолидированной таблицы. В данной работе мы познакомимся с основными этапами ETL на примере загрузки данных в электронные таблицы.

Бизнес-аналитика. Извлечение, преобразование и загрузка данных — читать онлайн ознакомительный отрывок

Ниже представлен текст книги, разбитый по страницам. Система сохранения места последней прочитанной страницы, позволяет с удобством читать онлайн бесплатно книгу «Бизнес-аналитика. Извлечение, преобразование и загрузка данных», без необходимости каждый раз заново искать на чём Вы остановились. Поставьте закладку, и сможете в любой момент перейти на страницу, на которой закончили чтение.

Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

NLMK

Рис. 3.37. Список голубых фишек

Задание. Найдите биржевой тикер для компании по своему варианту задания.

Задаём поиск по тикеру NLMK.

В результатах поиска находим данные Московской биржи (рис. 3.38).

У нас есть два указания на котировки данной ценной бумаги именно на Московской бирже:

NLMK.ME

Equity — MCX.

Рис. 3.38. Поиск по тикеру

Задание. Найдите страницу котировок компании на МосБирже

Результаты поиска представлены на рис. 3.39.

Переходим по ссылке для скачивания исторических данных:

Historical Data.

Рис. 3.39. Страница сведений о компании

Задание. Перейдите на страницу исторических данных.

На странице исторических данных можно увидеть таблицу котировок (рис. 3.40).

В строке адреса в браузере видим намёк на историю:

history.

Рис. 3.40. Исторические данные

Выбираем даты начала и конца исторического периода (рис. 3.41).

После настройки дат нажимаем кнопку

Done.

Убеждаемся, что нужные даты выставлены в строке

Time Period.

Нажимаем кнопку

Apply.

Рис. 3.41. Выбор диапазона дат

Задание. Настройте даты начала и конца периода так, чтобы получить данные за последние два года.

На странице сайта есть возможность скачать файл:

Download Data.

Эта возможность подходит тем, кто скачает один файл раз в год. Для регулярной загрузки и анализа данных требуется автоматическая процедура. Но такой запрос придётся настроить.

Для формирования запроса копируем строку адреса.

Возвращаемся в Excel.

Вызываем загрузку из интернета (рис. 3.42).

В строке адреса указан не только адрес страницы. В параметрах имеются ссылки на даты начала и конца периода.

Здесь имеется указание на загрузку дневных данных:

frequency=1d.

Рис. 3.42. Загрузка из интернета

Задание. Загрузите исторические данные с помощью запроса.

Дальнейшие действия мы уже обсуждали.

Выбираем нужную таблицу для извлечения.

Настраиваем преобразование данных.

Загружаем таблицу в Excel.

Задание. Извлеките и, преобразуйте и загрузите исторические данные в Excel.

5. Извлечение данных из файлов

При загрузке данных из файлов можно использовать сразу несколько источников данных. Можно извлечь данные из нескольких файлов в выбранном каталоге и объединить их в одну таблицу.

В этом разделе мы будем работать с котировками акций из списка отраслевого индекса. Когда наш запрос будет сформирован, мы сможем добавлять файлы в папку. После этого файлы будут загружаться автоматически — со всеми преобразованиями.

5.1. Варианты заданий

В каждом варианте указан отраслевой индекс Московской Биржи.

Номер варианта — последняя цифра номера зачётки. Для нуля берём вариант 10.

Варианты заданий приведены в таблице 5.1.

Задание. Опишите в отчёте свой вариант задания.

Отраслевые индексы включают в свой состав наиболее ликвидные акции компаний соответствующей отрасли экономики.

Чтобы ознакомиться с составом индекса, откроем в браузере сайт МосБиржи:

https://www.moex.com/

Переходим в следующий раздел:

Индексы — Все индексы.

Мы будем рассматривать в качестве примера индекс голубых фишек.

Далее переходим в раздел выбранного индекса и выбираем следующую ссылку:

База расчёта.

Получаем список тикеров акций, входящих в состав индекса (рис. 5.1).

Рис. 5.1. Состав индекса

Задание. Внесите в отчёт состав своего индекса.

5.2. Выбор акций

Выбираем в составе индекса пару компаний с самой большой КАПИТАЛИЗАЦИЕЙ — рыночной стоимостью всех акций. В составе индекса голубых фишек это следующие бумаги:

— SBER;

— GAZP.

Задаём поиск на сайте биржи по тикеру и выясняем, какие это акции:

— Публичное акционерное общество «Газпром», акция обыкновенная (GAZP);

— Публичное акционерное общество «Сбербанк России», акция обыкновенная (SBER).

Записываем в отчёте названия выбранных бумаг.

Задание. Выберите в составе индекса компании с самой высокой капитализацией и внесите в отчёт названия ценных бумаг.

Создадим новую папку. Здесь мы разместим несколько файлов для автоматической загрузки в Excel. Папку лучше разместить в корневом каталоге рабочего диска. Название папки должно быть коротким и информативным.

Нам совершенно не подходят такие названия:

— Папка;

— Папка 2;

— Новая папка;

Читать дальше
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

Похожие книги на «Бизнес-аналитика. Извлечение, преобразование и загрузка данных»

Представляем Вашему вниманию похожие книги на «Бизнес-аналитика. Извлечение, преобразование и загрузка данных» списком для выбора. Мы отобрали схожую по названию и смыслу литературу в надежде предоставить читателям больше вариантов отыскать новые, интересные, ещё непрочитанные произведения.


Отзывы о книге «Бизнес-аналитика. Извлечение, преобразование и загрузка данных»

Обсуждение, отзывы о книге «Бизнес-аналитика. Извлечение, преобразование и загрузка данных» и просто собственные мнения читателей. Оставьте ваши комментарии, напишите, что Вы думаете о произведении, его смысле или главных героях. Укажите что конкретно понравилось, а что нет, и почему Вы так считаете.

x