Валентин Арьков - Бизнес-аналитика. Извлечение, преобразование и загрузка данных

Здесь есть возможность читать онлайн «Валентин Арьков - Бизнес-аналитика. Извлечение, преобразование и загрузка данных» — ознакомительный отрывок электронной книги совершенно бесплатно, а после прочтения отрывка купить полную версию. В некоторых случаях можно слушать аудио, скачать через торрент в формате fb2 и присутствует краткое содержание. Год выпуска: 2020, Жанр: Прочая научная литература, Прочая околокомпьтерная литература, Руководства, popular_business, на русском языке. Описание произведения, (предисловие) а так же отзывы посетителей доступны на портале библиотеки ЛибКат.

Бизнес-аналитика. Извлечение, преобразование и загрузка данных: краткое содержание, описание и аннотация

Предлагаем к чтению аннотацию, описание, краткое содержание или предисловие (зависит от того, что написал сам автор книги «Бизнес-аналитика. Извлечение, преобразование и загрузка данных»). Если вы не нашли необходимую информацию о книге — напишите в комментариях, мы постараемся отыскать её.

Системы бизнес-аналитики работают с различными источниками данных с помощью функций ETL (Extract-Transform-Load). Название ETL можно перевести как «извлечение, преобразование и загрузка данных». Имеется в виду загрузка в хранилище данных для дальнейшей обработки в системе бизнес-аналитики.
В простейшем случае это загрузка данных в виде одной, объединённой, консолидированной таблицы. В данной работе мы познакомимся с основными этапами ETL на примере загрузки данных в электронные таблицы.

Бизнес-аналитика. Извлечение, преобразование и загрузка данных — читать онлайн ознакомительный отрывок

Ниже представлен текст книги, разбитый по страницам. Система сохранения места последней прочитанной страницы, позволяет с удобством читать онлайн бесплатно книгу «Бизнес-аналитика. Извлечение, преобразование и загрузка данных», без необходимости каждый раз заново искать на чём Вы остановились. Поставьте закладку, и сможете в любой момент перейти на страницу, на которой закончили чтение.

Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

Рис. 6.3. Копирование формулы

Задание. Введите формулу вычисления длины интервала и скопируйте её в остальные ячейки столбца. Рассмотрите формулы в ячейках и выясните, как оформлены ссылки на обобщённые показатели.

Копировать формулы не удалось. Значит, нам придётся вручную сформировать каждую формулу (рис. 6.4).

Теперь в каждой формуле появляются ссылки на разные значения поля «Тикер».

Рис. 6.4. Ссылки на ячейки сводной таблицы

Задание. Введите формулы вычисления интервала вручную. Обратите внимание на ссылки на ячейки сводной таблицы.

Переходим к группировке данных.

Создаём новую сводную таблицу.

Настраиваем поля следующим образом (рис. 6.5):

— Rows — VOL;

— Values — VOL;

— Filters — TICKER.

По строкам у нас будут значения объёмов. Далее мы их сгруппируем по интервалам.

Обобщённый показатель — количество значений по полю « Объём». Метод агрегирования выбираем вручную.

Фильтрация по полю « Тикер» позволит нам выбрать данные только по одной ценной бумаге.

Рис. 6.5. Поля сводной таблицы

Задание. Создайте сводную таблицу (рис. 6.5).

Устанавливаем фильтрацию по выбранному значению тикера (рис. 6.6).

Теперь мы обрабатываем данные только по одной акции.

Рис. 6.6. Фильтр по одной бумаге

Задание. Установите фильтрацию по одной бумаге.

Щёлкаем по заголовку любой строки и вызываем группировку в контекстном меню:

Group(рис. 6.7).

Рис. 6.7. Вызов группировки данных

В меню группировки автоматически введены минимальное и максимальное значения.

Нам остаётся вручную ввести величину интервала группировки. Введём округлённое значение (рис. 6.8).

Нажимаем ОК.

Рис. 6.8. Параметры группировки данных

Задание. Установите параметры группировки данных.

Рассмотрим результаты группировки (рис. 6.9).

Длинные заголовки пока не будем трогать. При желании можно перевести числа в миллионы вместо единиц.

В графе Countвыводится количество заполненных ячеек. Общее количество равно 253, как и было в исходных данных.

Рис. 6.9. Результаты группировки данных

Переводим абсолютные частоты (количество заполненных ячеек) в относительные частоты, выраженные в процентах (рис. 6.10).

Щёлкаем правой кнопкой по ячейке в графе « Количество» и выбираем в контекстном меню вывод в процентах от общего итога:

Show Values As — %of Grand Total.

Рис. 6.10. Относительные частоты

Задание. Настройте вывод частоты в процентах.

Зададим уникальное, краткое и информативное название нашей сводной таблице:

PivotTable Tools — Analyze — PivotTable — PivotTable Name.

Укажем, что это объёмы торгов акциями Газпрома (рис. 6.11):

GAZP_VOL.

Рис. 6.11. Название сводной таблицы

Задание. Присвойте короткое информативное название сводной таблице.

Рассмотрим список именованных объектов (рис. 6.12):

Formulas — Defined Names — Name Manager.

Как ни странно, ни одной сводной таблицы в этом списке нет. Здесь есть только «обычные» таблицы Excel, которые были отформатированы как таблицы.

Зато здесь можно пройтись по обычным таблицам и увидеть их названия. Неплохо будет навести порядок с названиями — хотя бы для них.

Рис. 6.12. Названия объектов

Задание. Просмотрите список названий объектов (таблиц). Присвойте таблицам Excel простые, короткие, понятные названия. Обратите внимание на отсутствие сводных таблиц в этом списке.

Мы провели группировку данных. Теперь по результатам группировки построим гистограмму (рис. 6.13).

Выбираем в верхнем меню вставку столбиковой диаграммы:

Insert — Charts — Insert Column or Bar Chart — 2-D Column — Clustered Column.

Рис. 6.13. Вставка гистограммы

Щёлкаем правой кнопкой по пустому прямоугольнику будущего графика и выбираем в контекстном меню:

Select Data.

Появляется диалоговое окно

Select Data Source.

В разделе

Legend Entries (Series)

нажимаем кнопку

Add(рис. 6.14).

Рис. 6.14. Добавление данных для графика

Выбираем столбец относительных частот в диалоговом окне

Edit Series(рис. 6.15).

Итоговое значение 100% нам не требуется.

Заголовок столбца тоже не выделяем.

Рис. 6.15. Выбор относительных частот

После выбора частот график начинает напоминать гистограмму. Пока что это столбиковая диаграмма с настройками по умолчанию.

Обратим внимание на строку

Series Values(рис. 6.15).

Читать дальше
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

Похожие книги на «Бизнес-аналитика. Извлечение, преобразование и загрузка данных»

Представляем Вашему вниманию похожие книги на «Бизнес-аналитика. Извлечение, преобразование и загрузка данных» списком для выбора. Мы отобрали схожую по названию и смыслу литературу в надежде предоставить читателям больше вариантов отыскать новые, интересные, ещё непрочитанные произведения.


Кондрашов Дмитриевич - Жизнь бизнес-аналитика
Кондрашов Дмитриевич
Отзывы о книге «Бизнес-аналитика. Извлечение, преобразование и загрузка данных»

Обсуждение, отзывы о книге «Бизнес-аналитика. Извлечение, преобразование и загрузка данных» и просто собственные мнения читателей. Оставьте ваши комментарии, напишите, что Вы думаете о произведении, его смысле или главных героях. Укажите что конкретно понравилось, а что нет, и почему Вы так считаете.

x