Рассмотренные ранее OLAP-технологии часто реализуются с помощью хранилищ данных, являющихся дальнейшим развитием реляционных баз данных.
Информационное хранилище(ИХ) представляют собой базу обобщенной информации, формируемую из множества внешних и внутренних источников, на основе которой выполняются статистические группировки и интеллектуальный анализ данных.
По сравнению с базами данных для оперативной обработки транзакций (транзакционных БД) ИХ обеспечивают более гибкое и простое формирование произвольных справочно-аналитических запросов, а также применение специализированных методов статистического и интеллектуального анализа данных.
В основе информационного хранилища лежит понятие многомерного информационного пространства или гиперкуба (рис.3.4), в ячейках которого хранятся анализируемые числовые показатели (например, объемы оборота, издержек, инвестиций и т.д.). Измерениями (осями) гиперкуба являются признаки анализа (например, время, группа продукции, регион, тип процесса, тип клиента и др.). При хранении признаки анализа отделяются от фактических данных, образуя так называемую инвертированную организацию хранения данных или структуру данных типа «звезда».
|
|
Рис. 4.13. Многомерная организация информационного хранилища
К особенностям хранимой информации в ИХ относятся:
- интеграция или обобщение данных в ИХ из транзакционных баз данных по всем бизнес-процессам и структурным подразделениям предприятия в виде единого многомерного информационного пространства. Например, организуется хранение показателей объемов производства, сбыта, сервиса и т.д. в продуктовом, территориальном, отраслевом, временном и других разрезах;
- произвольность агрегации данных на основе отделения от фактических данных независимых и равноправных измерений информационного пространства (признаков анализа информации, разрезов) в виде иерархий агрегации. Например, региональный признак анализа представляется в виде иерархии агрегации: «область - район - город - село», временной признак «год - квартал - месяц-день» и т.д.;
- обязательное хранение временного признака в данных, дающего возможность отслеживать динамику изменения показателей в течение длительного периода времени;
- непротиворечивость данных во всех используемых источниках в течение определенного периода времени (например, дня), которая позволяет обеспечить единую точку зрения всех пользователей на экономическую систему;
- обеспечение множества представлений структуры информационного хранилища для различных категории пользователей: руководителей, аналитиков, менеджеров направлений деятельности. Отбор набора показателей и признаков анализа определяет предметную ориентированность информационного хранилища или организацию витрин данных.
|
|
С технологической точки зрения к архитектуре ИХ предъявляются общие требования:
-Единообразно определенная структура многомерных данных с равноправными измерениями информационного пространства.
-Пользователь не должен знать о том, где хранятся данные, как они организованы и как обрабатываются.
-Поддержка многопользовательского режима оперативного анализа в среде «клиент-сервер».
-Легкая адаптация к новым информационным потребностям путем добавления новых показателей и измерений.
-Автоматическое обновление информации из оперативных баз данных.
- Выполнение запросов без ограничений на количество измерений и уровней их агрегации примерно с одинаковым временем реакции на запрос.
- Удобный, «интуитивный» интерфейс пользователя, обеспечивающий простоту манипулирования данными.