Валентин Арьков - Бизнес-аналитика. Извлечение, преобразование и загрузка данных

Здесь есть возможность читать онлайн «Валентин Арьков - Бизнес-аналитика. Извлечение, преобразование и загрузка данных» — ознакомительный отрывок электронной книги совершенно бесплатно, а после прочтения отрывка купить полную версию. В некоторых случаях можно слушать аудио, скачать через торрент в формате fb2 и присутствует краткое содержание. Год выпуска: 2020, Жанр: Прочая научная литература, Прочая околокомпьтерная литература, Руководства, popular_business, на русском языке. Описание произведения, (предисловие) а так же отзывы посетителей доступны на портале библиотеки ЛибКат.

Бизнес-аналитика. Извлечение, преобразование и загрузка данных: краткое содержание, описание и аннотация

Предлагаем к чтению аннотацию, описание, краткое содержание или предисловие (зависит от того, что написал сам автор книги «Бизнес-аналитика. Извлечение, преобразование и загрузка данных»). Если вы не нашли необходимую информацию о книге — напишите в комментариях, мы постараемся отыскать её.

Системы бизнес-аналитики работают с различными источниками данных с помощью функций ETL (Extract-Transform-Load). Название ETL можно перевести как «извлечение, преобразование и загрузка данных». Имеется в виду загрузка в хранилище данных для дальнейшей обработки в системе бизнес-аналитики.
В простейшем случае это загрузка данных в виде одной, объединённой, консолидированной таблицы. В данной работе мы познакомимся с основными этапами ETL на примере загрузки данных в электронные таблицы.

Бизнес-аналитика. Извлечение, преобразование и загрузка данных — читать онлайн ознакомительный отрывок

Ниже представлен текст книги, разбитый по страницам. Система сохранения места последней прочитанной страницы, позволяет с удобством читать онлайн бесплатно книгу «Бизнес-аналитика. Извлечение, преобразование и загрузка данных», без необходимости каждый раз заново искать на чём Вы остановились. Поставьте закладку, и сможете в любой момент перейти на страницу, на которой закончили чтение.

Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

Рис. 6.42. Данные по бумагам без группировки

Задание.Постройте сводную таблицу (рис. 6.42).

Построим диаграмму динамики

Insert — Charts — Insert Line or Area Chart — 2D Line — Line.

В сводной таблице отключаем промежуточные годовые итоги.

Выбираем данные для графика.

Это будут два разных набора данных их разных колонок.

По оси «иксов» пока ничего не указываем. Здесь отображаются порядковые номера точек.

Поскольку уровни цен разные, настроим раздельные оси для каждого графика.

Format Data Series — Series Options — Series Options — Plot Series On — Secondary Axis.

Задаём масштаб по каждой оси отдельно, чтобы на графике не было пустого места (рис. 6.43).

Горизонтальную ось отключаем:

Primary Horizontal

На таком графике можно видеть развитие событий во времени.

Рис. 6.43. Оформление графика

Задание.Постройте диаграмму динамики.

Мы рассмотрели процедуру анализа для одной пары бумаг.

Теперь нужно проделать описанные шаги для остальных возможных сочетаний. Для начала попробуйте определить, сколько вариантов нам предстоит рассмотреть. СОЧЕТАНИЕ — это понятие из области комбинаторики.

Задание. Прочитайте в Википедии статью «Сочетание» и определите количество сочетаний из пяти бумаг по две акции.

В специализированных пакетах программ есть возможность проводить анализ взаимосвязи сразу по списку из нескольких переменных. Результаты такого анализа — «матрица» из нескольких графиков — гистограмм и диаграмм разброса.

Задание.Найдите в Картинках Яндексаизображения на тему correlation matrix plot.

Конечно, мы не будем исследовать все возможные комбинации. Хотя, конечно, было бы интересно. Мы ограничимся тремя дополнительными заданиями.

Задание. Проведите анализ взаимосвязи для трёх сочетаний (по две акции).

Мы прошлись по основным этапам загрузки и обработки данных. Мы прошли по кругу и вернулись к началу.

Функции ETL настраивают в виде сценариев или процедур так, чтобы затем многократно их использовать. Когда в источнике данных происходят изменения, эти новые данные загружаются в систему бизнес-аналитики автоматически. Или по требованию пользователя:

Refresh.

Соответственно, должна обновиться наша объединённая таблица, а вслед за ней — все результаты анализа, таблицы и графики.

Задание. Скачайте данные для выбранных для исследования акций за последние пять лет и поместите файлы в каталог для загрузки. Вызовите обновление запроса на загрузку. Убедитесь в изменении объединённой таблицы и результатов анализа.

Заключение

В этой работе мы познакомились с процедурой извлечения, преобразования и загрузки данных. Английское название: ETL. Это подготовка данных для анализа в системах бизнес-аналитики.

Мы убедились в том, что это долгая и кропотливая работа. Она подходит не всем. Работа с данными, с числами требует терпения, усидчивости и внимательности. А ещё требуется некоторый кругозор. Все источники данных разные. Да ещё в них будут самые разные ошибки и нестыковочки.

Это подготовка данных для анализа. И нужна эта подготовка в конечном счёте для того, чтобы потом руководитель смог посмотреть на экран и за пару секунд понять, как идут дела в его компании или подразделении.

Попутно мы немного расширили свой кругозор и эрудицию. Немного приблизились к общему пониманию. Ещё это называется цельная или целостная картина мира. Зачем же это нужно? Есть такое любопытное высказывание: знание общих закономерностей может скомпенсировать незнание какого-то отдельного факта.

Задание. Найдите в интернете последнюю фразу и выясните, кто автор этого высказывания.

Литература

1. Паклин Н. Б., Орешков В. И. Бизнес-аналитика — от данных к знаниям: учебное пособие. — СПб.: ПИТЕР, 2013. — 702 с.

2. Винстон У. Л. Бизнес-моделирование и анализ данных. Решение актуальных задач с помощью Microsoft Excel. — СПб.: Питер, 2018. — 864 с.

3. Александер М. Excel 2019. Библия пользователя. Исчерпывающее руководство. — СПб.: Диалектика, 2019. — 1136 с.

4. Джелен Б., Александер М. Сводные таблицы в Microsoft Excel 2013. — М.: Вильямс, 2017. — 448 с.

5. Барсегян А. А. Анализ данных и процессов: учебное пособие. — СПб.: БХВ, 2019. — 512 с.

6. Арьков В. Ю. Анализ распределения в Excel: Учебное пособие. — [б. м.]: Издательские решения, 2019. — 158 с.

Режим доступа:

https://ridero.ru/books/analiz_raspredeleniya_v_excel/

7. Арьков В. Ю. Статистический анализ взаимосвязи в Excel: Учебное пособие. — [б. м.]: Издательские решения, 2019. — 146 с.

Читать дальше
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

Похожие книги на «Бизнес-аналитика. Извлечение, преобразование и загрузка данных»

Представляем Вашему вниманию похожие книги на «Бизнес-аналитика. Извлечение, преобразование и загрузка данных» списком для выбора. Мы отобрали схожую по названию и смыслу литературу в надежде предоставить читателям больше вариантов отыскать новые, интересные, ещё непрочитанные произведения.


Кондрашов Дмитриевич - Жизнь бизнес-аналитика
Кондрашов Дмитриевич
Отзывы о книге «Бизнес-аналитика. Извлечение, преобразование и загрузка данных»

Обсуждение, отзывы о книге «Бизнес-аналитика. Извлечение, преобразование и загрузка данных» и просто собственные мнения читателей. Оставьте ваши комментарии, напишите, что Вы думаете о произведении, его смысле или главных героях. Укажите что конкретно понравилось, а что нет, и почему Вы так считаете.

x