Дизайн хранилищ данных

Существуют два архитектурных направления – нормализованные хранилища данных и хранилища с измерениями.

В нормализованных хранилищах, данные находятся в предметно ориентированных таблицах третьей нормальной формы. Нормализованные хранилища характеризуются как простые в создании и управлении, недостатки нормализованных хранилищ – большое количество таблиц как следствие нормализации, из-за чего для получения какой-либо информации нужно делать выборку из многих таблиц одновременно, что приводит к ухудшению производительности системы.

Хранилища с измерениями используют схему «звезда» или схему «снежинка». При этом в центре «звезды» находятся данные (Таблица фактов), а измерения образуют лучи звезды.

Источниками данных могут быть:

Традиционные системы регистрации операций

Отдельные документы

Наборы данных

Операции с данными:

Извлечение – перемещение информации от источников данных в отдельную БД, приведение их к единому формату.

Преобразование – подготовка информации к хранению в оптимальной форме для реализации запроса, необходимого для принятия решений.

Загрузка – помещение данных в хранилище, производится атомарно, путем добавления новых фактов или корректировкой существующих.

Анализ – OLAP, Data Mining, сводные отчёты.

Представление результатов анализа.

Дисциплина «Проектирование информационных систем»


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  




Подборка статей по вашей теме: