Информационно-поисковые системы и их классификация
Довольно часто возникают ситуации, когда в большом объеме информации разыскивается та, которая нужна в данный момент, при этом для объекта поиска существенными являются значения лишь некоторых признаков. Например, для автомобилей признаками являются: объем двигателя, расход топлива, мощность; для книги: название, фамилия автора, год и месяц издания и т.д. Каждый из нас когда-то занимался подобной рутинной работой: поиск объекта по значению признаков. С появлением компьютеров оказалось, что эту работу можно поручить ЭВМ. Для этого создаются информационно-поисковые системы (ИПС).
Информационно-поисковая система – это прикладная компьютерная среда для обработки, хранения, сортировки, фильтрации и поиска больших массивов структурированной информации.
Каждая ИПС предназначена для решения определенного класса задач, для которых характерен свой набор объектов и их признаков. ИПС бывают двух типов:
1. Документографические. В таких ИПС все хранимые документы индексируются специальным образом, т. е. каждому документу присваивается индивидуальный код, составляющий поисковый образ. Поиск идет не по самим документам, а по их поисковым образам. Именно так ищут книги в больших библиотеках. Сначала отыскивают карточку в каталоге, а затем по номеру, указанному на ней, отыскивается и сама книга.
|
|
2. Фактографические. В таких ИПС хранятся не документы, а факты, относящиеся к какой-либо предметной области. Поиск осуществляется по образцу факта.
Каждая ИПС состоит из двух частей: базы данных (БД) и системы управления базами данных (СУБД).
База данных – это поименованная совокупность структурированных данных, относящихся к определенной предметной области.
Система управления базами данных – это комплекс программных и языковых средств, необходимых для создания баз данных, поддержания их в актуальном состоянии и организации поиска в них необходимой информации.
На настоящий момент существует множество различных СУБД. Наиболее широкую известность получили такие как Dbase, Clipper, FoxPro, Paradox, Microsoft Access.
Поле – элементарная единица логической организации данных, которая соответствует неделимой единице информации – реквизиту. Для описания поля используются следующие характеристики:
- имя, например. Фамилия, Имя, Отчество, Дата рождения;
- тип, например, символьный, числовой, календарный;
- длина, например, 15 байт, причем будет определяться максимально возможным количеством символов;
- точность для числовых данных, например два десятичных знака для отображения дробной части числа.
Запись – совокупность логически связанных полей.
Экземпляр записи – отдельная реализация записи, содержащая конкретные значения ее полей.
Файл (таблица) – упорядоченная структура, состоящая из конечного набора однотипных записей.