В качестве основы хранилища данных, как правило, используется реляционная модель хранения данных, что существенно облегчает дальнейшее развитие такого хранилища. Впрочем, имеет место и другой путь – применение оптимизированных структур, например многомерных (по этому пути пошли разработчики компании SAP в своем продукте SAP BW). Однако, по мнению ряда исследователей (например, Б. Инмона [Inmon, 1999]), такой подход имеет целый ряд недостатков, не являясь достаточно гибким и универсальным. В самом деле, если данные из хранилища поступают лишь в ограниченное количество витрин данных и аналитических приложений, то от хранилища вовсе не требуется поддерживать специализированные запросы. В этом отношении использование реляционных баз данных экономичнее (без потери функциональности), а следовательно, предпочтительнее.
После того как хранилище построено, встает вопрос об использовании данных конечными пользователями. При этом могут применяться различные средства (от специализированных средств создания пользовательских запросов и отчетов до электронных таблиц) в зависимости от решаемых задач, предпочтений и опыта пользователей. И все же есть целый спектр задач, которые предъявляют к информационным системам особые требования: это задачи, требующие оперативной (т. е. в режиме реального времени) обработки достаточно больших объемов данных в разных аналитических разрезах. Экономический анализ, как правило, бывает многомерным: информация может быть сгруппирована и консолидирована по разным признакам, причем разные группы пользователей информации заинтересованы в разных способах группировки.
Таким образом, превращение разрозненных данных в структурированную информацию, описанную в экономических терминах и обеспечивающую поддержку принятия управленческих решений, можно считать одной из самых актуальных задач. При этом обработка данных и принятие решений должны быть настолько оперативными, насколько этого требуют интересы бизнеса. Именно для этого предназначены специальные системы аналитической обработки данных в режиме реального времени – OLAP-системы.
Идея обработки многомерных данных восходит к 1962 г., когда Кен Айверсон (Ken Iverson) опубликовал свою работу «Язык программирования» (A Programming Language – APL) [Iverson, 1962]. APL – это математически определенный язык с многомерными переменными и изящными, но довольно абстрактными операторами. В 1970-е и 1980-е гг. он активно использовался во многих деловых приложениях, функционально схожих с современными OLAP-системами.
В 1970 г. впервые появился прикладной программный продукт для многомерного анализа данных – Express. Определенные модификации данного продукта широко используется в современных OLAP-системах, однако изначальные концепции 70-х остались далеко позади.
В 1992 г. был выпущен Essbase – первый OLAP-продукт, завоевавший большую долю рынка и удерживающий лидирующие позиции по сегодняшний день.
В 1993 г. вышла в свет статья Е. Ф. Кодда (E. F. Codd), в которой впервые было дано формальное определение OLAP-технологии [Codd Е., Codd С., Salley, 1993]. Эта работа получила большой резонанс и привлекла внимание к возможностям многомерного анализа. В статье было описано 12 правил OLAP, к которым чуть позже (в 1995 г.) было добавлено еще несколько. Все эти правила были разделены на четыре группы и названы характеристиками (features).
К правилам OLAP относятся:
• основные характеристики – многомерность модели данных, интуитивные механизмы манипулирования данными, доступность данных, пакетное извлечение данных, клиент-серверная архитектура, прозрачность, многопользовательская работа;
• специальные характеристики – обработка ненормализованных данных, хранение результатов отдельно от исходных данных, выделение отсутствующих данных, обработка отсутствующих значений;
• характеристики построения отчетов – гибкое построение отчетов, стабильная производительность при построении отчетов, автоматическое регулирование физического уровня;
• управление размерностью – общая функциональность, неограниченное число измерений и уровней агрегирования, неограниченные операции между данными различных измерений.
Универсальным критерием определения OLAP как аналитического инструмента является тест FASMI (Fast Analysis of Shared Multidimensional Information) – быстрый анализ разделяемой многомерной информации. Рассмотрим детально каждую составляющую этой аббревиатуры [Родионов, Исаев, 2002].
Читать дальше
Конец ознакомительного отрывка
Купить книгу