Отметим, что передача данных из трансакционных систем в аналитические приложения может производиться как последовательно, через все обозначенные ярусы аналитической пирамиды, так и более коротким путем, минуя один или несколько уровней (это отражено на схеме в виде стрелки «Bypass» – прямая передача). Способ передачи данных зависит как от технических возможностей программных продуктов, так и от того, каким образом предполагается использовать те или иные данные.
Казалось бы, трансакционные системы, располагающие всей первичной информацией, могут применяться в качестве самодостаточных аналитических средств. Это действительно так, но только в случае, если речь идет об анализе на уровне отдельных операций. Но если аналитические задачи выходят за рамки управления операциями, на уровни тактического и стратегического управления, то такие задачи должны опираться на агрегированную информацию, сформированную на основе первичных данных из разных трансакционных систем. Кроме того, важным требованием к аналитике является многовариантность (возможность формирования и оценки разных сценариев, в том числе гипотетических), что также не обеспечивается трансакционными системами. Поэтому для решения многих аналитических задач (в том числе для стратегического анализа и управления) рекомендуется использование систем, расположенных на других, более высоких уровнях аналитической пирамиды.
Системы бизнес-интеллекта
Понятие систем бизнес-интеллекта (Business Intelligence – BI) является довольно емким и объединяет различные средства анализа и обработки данных масштаба предприятия. Среди BI-систем можно выделить такие составляющие, как хранилища и витрины данных, инструменты оперативной аналитической обработки (OLAP-системы), средства обнаружения знаний, а также средства формирования запросов и построения отчетов. Важную роль среди BI-систем играют хранилища данных, обеспечивающие сбор, упорядочение и хранение больших объемов информации, полученной из разных источников. Поэтому рассмотрение среднего звена аналитической пирамиды целесообразно начать именно с хранилищ данных.
Хранилища данных (data warehouse – DW) находятся на следующем после трансакционных систем уровне аналитической пирамиды. Один из авторитетных специалистов в этой области, Билл Инмон (Bill Inmon), определяет хранилища данных как «предметно-ориентированные, интегрированные, стабильные, поддерживающие хронологию наборы данных, используемые для поддержки принятия управленческих решений» [Inmon, 1992, p. 29]. Ценность хранилищ данных заключается в том, что они представляют собой крупные базы данных масштаба предприятия, которые содержат определенную информацию и обеспечивают ее оперативное представление в виде, удобном для пользователя или дальнейшей обработки другими аналитическими системами. Часто хранилища данных обладают структурой, учитывающей отраслевую специфику деятельности организации. Однако даже такая структура не всегда способна обеспечить необходимые возможности анализа больших объемов данных, особенно в режиме реального времени. Эта проблема решается на следующих уровнях иерархии – на уровнях витрин данных и OLAP-систем.
Витрины данных (data marts), как и хранилища, представляют собой структурированные информационные массивы, но их отличие состоит в том, что витрины данных в еще большей степени являются предметно-ориентированными. Как правило, витрина содержит информацию, относящуюся к какому-либо определенному предметному направлению деятельности организации. Поэтому информация в витринах данных хранится в специальном виде, наиболее подходящем для решения конкретных аналитических задач или обработки запросов определенной группы аналитиков.
Есть два взгляда на витрины данных. В одном случае витрина, по сути, представляет собой часть хранилища, оптимизированную для запросов к данным конкретной предметной области, в том числе для передачи этих данных для последующей обработки в другие аналитические системы. В другом случае витрина – это OLAP-куб или его часть, оптимизированная для запросов пользователей к информации конкретной предметной области. Поэтому с точки зрения организации хранения данных витрины могут быть как реляционными, так и многомерными, однако в любом случае они обладают таким общим свойством, как предметная ориентированность.
Следующий уровень аналитической пирамиды занимают OLAP-системы (On-Line Analytical Processing) – системы аналитической обработки данных в режиме реального времени. Такие системы могут работать со всеми необходимыми данными и способны обеспечить решение широкого спектра аналитических задач. Примерами задач, решаемых при помощи OLAP-систем, могут служить финансово-экономический анализ, оценка степени достижения целевых значений ключевых показателей, анализ и прогнозирование рыночной ситуации.
Читать дальше
Конец ознакомительного отрывка
Купить книгу