Технология хеширования

Хеширование – технология быстрого прямого доступа к записи БД на основе заданного значения некоторого поля записи, как правило, ключевого. Каждая запись БД размещается по адресу, кот. Вычисляет СУБД с помощью хеш-функции на основе значения ключевого поля этой записи(хеш-поля). Вычисляемый адрес наз. хеш-адресом. Данный метод требует заранее резервировать место на диске для размещения файла БД (это явл.недостатком.)

Показателем эффективной стратегии прямого доступа к записям служит малое время поиска и малое число конфликтов. Лучше всего это достигается, если используется алгоритм хеширования, равномерно распределяющий записи по областям записи.

Наилучший метод сост. в использ.хеш- функции, кот.опред.адрес хранения записи на основе остатка от деления значений ключа на размер файла в блоках. В этом случае записи файла БД упорядочиваются по значениям ключевого поля.

Два способа решения проблем конфликтов.

1) Запись, для кот.вычисляемый хеш-адрес занят, помещается в область переполнения файла БД.

2) Запись, вступившая в конфликт, помещается а некот.свободное место файла, начиная от тек. Занятой позиции.

Использование хеширования в качестве способа адресации записей избавляет от необход.поддерж.и просматр.индексы.Этот медот испльз.когда необход. Быстро забронировать место в гостинице или предвар.заказать билет.

Сжатие данных на основе различий

Наиболее распростран.технолог. сжатия на основе различий, когда некоторое значение заменяется сведениями об его отличиях от предыд.значения. Один из способов применения этой технологии – удаление повторяющихся символов в начале каждой записи с указанием их кол-ва. Для реализ.такой технол.требуется размещать данные последовательно, т.к. для их распаковки надо иметь значение предыд. данного. Прим. До сжатия: Эколог….Экология……Экологический…….После сжатия: 0 – эколог 6- ия 7 – ческий.

Иерархическое сжатие

Иерархическое сжатие – сжатие, при кот.постоянные части записей, логически объединенных в группы, записываются один раз.

Пусть в файле ПРОДУКТЫ записи упорядочены по возрастанию значений номера накладной(поляНН). Тогда группы записей о покупателях, купивших тот или иной продукт, можно сжать в отдельные иерархические записи. Выдел. 2 части:

1) постоянную –номер накладной и код покупателя

2) переменную – данные о продуктах:наименов., кол-во, цена


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: