Хранилища данных и их применение для решения аналитических задач с помощью аналитических измерений

Рассмотренные ранее OLAP-технологии часто реализуются с помощью хранилищ данных, являющихся дальнейшим развитием реляционных баз данных.

Информационное хранилище(ИХ) представляют собой базу обобщенной информации, формируемую из множества внешних и внутренних источников, на основе которой выполняются статистические группировки и интеллектуальный анализ данных.

По сравнению с базами данных для оперативной обработки транзакций (транзакционных БД) ИХ обеспечивают более гибкое и простое формирование произволь­ных справочно-аналитических запросов, а также применение спе­циализированных методов статистического и интеллектуально­го анализа данных.

В основе информационного хранилища лежит понятие мно­гомерного информационного пространства или гиперкуба (рис.3.4), в ячейках которого хранятся анализируемые числовые по­казатели (например, объемы оборота, издержек, инвестиций и т.д.). Измерениями (осями) гиперкуба являются признаки анали­за (например, время, группа продукции, регион, тип процесса, тип клиента и др.). При хранении признаки анализа отделяются от фактических данных, образуя так называемую инвертирован­ную организацию хранения данных или структуру данных типа «звезда».

 
 


Рис. 4.13. Многомерная организация информационного хранилища

К особенностям хранимой информации в ИХ относятся:

- интеграция или обобщение данных в ИХ из транзакционных баз данных по всем бизнес-процессам и структурным подраз­делениям предприятия в виде единого многомерного инфор­мационного пространства. Например, организуется хранение показателей объемов производства, сбыта, сервиса и т.д. в продуктовом, территориальном, отраслевом, временном и других разрезах;

- произвольность агрегации данных на основе отделения от фак­тических данных независимых и равноправных измерений информационного пространства (признаков анализа инфор­мации, разрезов) в виде иерархий агрегации. Например, ре­гиональный признак анализа представляется в виде иерархии агрегации: «область - район - город - село», временной при­знак «год - квартал - месяц-день» и т.д.;

- обязательное хранение временного признака в данных, даю­щего возможность отслеживать динамику изменения показа­телей в течение длительного периода времени;

- непротиворечивость данных во всех используемых источни­ках в течение определенного периода времени (например, дня), которая позволяет обеспечить единую точку зрения всех пользователей на экономическую систему;

- обеспечение множества представлений структуры информа­ционного хранилища для различных категории пользовате­лей: руководителей, аналитиков, менеджеров направлений деятельности. Отбор набора показателей и признаков анализа определяет предметную ориентированность информационно­го хранилища или организацию витрин данных.

С технологической точки зрения к архитектуре ИХ предъяв­ляются общие требования:

-Единообразно определенная структура многомерных данных с равноправными измерениями информационного простран­ства.

-Пользователь не должен знать о том, где хранятся данные, как они организованы и как обрабатываются.

-Поддержка многопользовательского режима оперативного анализа в среде «клиент-сервер».

-Легкая адаптация к новым информационным потребностям путем добавления новых показателей и измерений.

-Автоматическое обновление информации из оперативных баз данных.

- Выполнение запросов без ограничений на количество изме­рений и уровней их агрегации примерно с одинаковым вре­менем реакции на запрос.

- Удобный, «интуитивный» интерфейс пользователя, обеспечи­вающий простоту манипулирования данными.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: