Логика поиска. Критерий смыслового соответствия. Теоретико-множественное представление

Технология обработки информации – упорядоченная последовательность взаимосвязанных действий, выполняемых с момента восприятия информации до момента получения заданных результатов.

Информационная технология – это система методов, способов и средств для сбора, регистрации, хранения, поиска, накопления, обработки [..] информации.

Поиск информации – одна из основных функций ИТ.

Поиск – это процесс, в ходе которого в той или иной последовательности производится соотнесение отыскиваемого с каждым объектом, хранящимся в массиве.

Особенности поиска:сравниваются не сами объекты, а поисковые образы

сам процесс поиска является неодноактным и многоитерационным

Алгоритм поиска:-выборка очередного объекта из массива для выполнения сравнения с запрашиваемым;

-процесс сравнения;

-принятие решения о соответствии;

-переход к следующему объекту или завершение процесса.

Выделяют два вида поиска:

-поиск целостного объекта (выдается весь документ)

-поиск информации по содержанию (некоторой части содержания)

Технология поиска может осуществляться по массиву двух видов:

-с прямой организацией – документы расположены в произвольном порядке (по мере занесения)

-с инвертированной организацией – имеется дополнительное разбиение на категории, обозначенные идентификаторами (с инвертированным справочником)

Критерий смыслового соответствия (или критерий выдачи)– это правило, позволяющее решать вопрос о выдаче или не выдаче документа при организации поиска.

КСС-основа алгоритма поиска информации в ИПС.

Виды КСС:условие выдачи – полное вхождение ПОЗ в ПОД, т.е документ выдается, если множество дескрипторов, образующее ПОЗ полностью входит в множество дескрипторов, содержащихся в ПОД

Документ выдается, если ПОД и ПОЗ совпадают частично.

Если для каждого дескриптора запроса в ПОД встретился либо сам дескриптор, либо дескриптор, связанный с ним (базисными отношениями)

С учетом весовых коэффициентов. Каждому информативному слову в запросе приписывается весовой коэфф.Весовые коэфф-ы в ПОЗ определяются пользователем и нормируются.Документ выдастся, если сумма весовых коэффициентов совпавших дескрипторов больше заранее установленной величины.

С учетом синтаксических отношений.(такие, как объединение, пересечение).

Теоретико-множественное представление.

Теоретико-множественные представления базируются на понятиях: множество, элементы множества и отношения на множествах.

Систему можно отобразить в виде совокупности разнородных множеств и отношений между ними.

Множества могут задаваться:

Перечислением, например {ai}, где i=1…n

Путем указания некоторого характеристического свойства А, например «множество натуральных чисел»

В основе теоретико-множественных преобразований лежит принцип перехода от одного способа задания множества к другому: А=<a1,…,an>

В множестве м.б вделены подмножества.

Пустое множество-то, в котором на данный момент нет ни одного элемента.

При использовании теоретико-множественных представлений можно вводить отношения:

Множество А, дополнение множества А, объединение А и В, пересечение(на диаграммах Эйлера-Венна)


23.Информация в системе воспроизводства знаний (системный подход). Информационные компоненты в системах управления.

Обрабатываемые (преобразуемые) объекты (в частности и сама среда)

имеют преимущественно абстрактную природу (идеальное, а не

материальное происхождение).

Для процесса постановки–решения задачи (как ситуации

определенного выбора) характерно наличие следующих четырех

компонентов:

- субъект, осуществляющий выбор;

- среда решения – принятые в качестве рабочих понятия, гипотезы,

законы, парадигмы и т.п.;

- доступные средства решения и практических действий;

- возможные результаты.

Типы информационных компонентов (сообщений ):

− фактографическая информация, фиксирующуая ситуацию (состояние

взаимодействия системы со средой) как результат преобразования;

− систематическую информацию, определяющую прагматические условия

(принципы, законы, критерии) применения преобразования и/или построения системы.

для систем управления информационными потоками (информационной

деятельности) – это метаинформация: тезаурусы, классификаторы и т.д.


24.Уровневая модель информационного взаимодействия "Пользователь - АИПС". Основные этапы (общая схема) поиска информации.

Начало поиска
Формирование запроса
Поиск
Просмотр
Оценка
Удовлетворительно?
Завершение поиска
Реформулировка запроса
да
нет

Первый уровень взаимодействия - это взаимодействие когнитивного уровня человека-оператора и поверхностного уровня компьютерной системы (интерфейса).

Второй уровень - взаимодействие когнитивного уровня человека-оператора и уровня процессов и задач.

Третий - взаимодействие пользователя с предоставляемой системой информацией; является самым сложным и практически не формализуемым уровнем общения.

Этапы поиска:

1) определение темы запроса, ее локализация в предметной области и формализация на уровне понятий основной и смежных областей, а также идентификация ресурса.

2)формирование, структурное и лексическое адаптирование выражения запроса, где система предоставляет вспомогательные информационные объекты (словари, тезаурусы, шаблоны и т. д.);

3)отбор документов с помощью одного из механизмов поиска по критерию, адекватному степени неопределенности информационной потребности, система предоставляет выбор механизма поиска или автоматически с помощью лексикографических словарей и проблемно-ориентированных тезаурусов нормирует и расширяет лексику запроса;

4)формирование и управление выдачей найденных документов, где система обеспечивает масштабирование пространства представления выданных документов, а также сортировку и рубрицирование или ранжирование по некоторому формальному критерию соответствия;

5)оценку результата поиска на уровне отдельного документа, где система обеспечивает возможность фиксировать значение степени соответствия запросу пользователя и использование лексики документов для непосредственной модификации выражения запроса;

6) итоговую оценку результатов поиска на уровне всего запроса или отдельных предложений с точки зрения принятия решения о завершении поискового процесса, где система позволяет количественно оценивать динамику выдач и обеспечивает возможность выборочного обращения к результатам отдельных этапов поиска или формирования проблемно-ориентированных словарей;

7) развитие процесса поиска по технологии реформулирования запроса по обратной связи по релевантности или использование каких-либо других ресурсов, например, ассоциированных БД вторичной или справочной информации, где роль системы - адекватное информирование о такого рода возможностях.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: