Технология обработки информации – упорядоченная последовательность взаимосвязанных действий, выполняемых с момента восприятия информации до момента получения заданных результатов.
Информационная технология – это система методов, способов и средств для сбора, регистрации, хранения, поиска, накопления, обработки [..] информации.
Поиск информации – одна из основных функций ИТ.
Поиск – это процесс, в ходе которого в той или иной последовательности производится соотнесение отыскиваемого с каждым объектом, хранящимся в массиве.
Особенности поиска:сравниваются не сами объекты, а поисковые образы
сам процесс поиска является неодноактным и многоитерационным
Алгоритм поиска:-выборка очередного объекта из массива для выполнения сравнения с запрашиваемым;
-процесс сравнения;
-принятие решения о соответствии;
-переход к следующему объекту или завершение процесса.
Выделяют два вида поиска:
-поиск целостного объекта (выдается весь документ)
-поиск информации по содержанию (некоторой части содержания)
|
|
Технология поиска может осуществляться по массиву двух видов:
-с прямой организацией – документы расположены в произвольном порядке (по мере занесения)
-с инвертированной организацией – имеется дополнительное разбиение на категории, обозначенные идентификаторами (с инвертированным справочником)
Критерий смыслового соответствия (или критерий выдачи)– это правило, позволяющее решать вопрос о выдаче или не выдаче документа при организации поиска.
КСС-основа алгоритма поиска информации в ИПС.
Виды КСС:условие выдачи – полное вхождение ПОЗ в ПОД, т.е документ выдается, если множество дескрипторов, образующее ПОЗ полностью входит в множество дескрипторов, содержащихся в ПОД
Документ выдается, если ПОД и ПОЗ совпадают частично.
Если для каждого дескриптора запроса в ПОД встретился либо сам дескриптор, либо дескриптор, связанный с ним (базисными отношениями)
С учетом весовых коэффициентов. Каждому информативному слову в запросе приписывается весовой коэфф.Весовые коэфф-ы в ПОЗ определяются пользователем и нормируются.Документ выдастся, если сумма весовых коэффициентов совпавших дескрипторов больше заранее установленной величины.
С учетом синтаксических отношений.(такие, как объединение, пересечение).
Теоретико-множественное представление.
Теоретико-множественные представления базируются на понятиях: множество, элементы множества и отношения на множествах.
Систему можно отобразить в виде совокупности разнородных множеств и отношений между ними.
Множества могут задаваться:
Перечислением, например {ai}, где i=1…n
|
|
Путем указания некоторого характеристического свойства А, например «множество натуральных чисел»
В основе теоретико-множественных преобразований лежит принцип перехода от одного способа задания множества к другому: А=<a1,…,an>
В множестве м.б вделены подмножества.
Пустое множество-то, в котором на данный момент нет ни одного элемента.
При использовании теоретико-множественных представлений можно вводить отношения:
Множество А, дополнение множества А, объединение А и В, пересечение(на диаграммах Эйлера-Венна)
23.Информация в системе воспроизводства знаний (системный подход). Информационные компоненты в системах управления.
Обрабатываемые (преобразуемые) объекты (в частности и сама среда)
имеют преимущественно абстрактную природу (идеальное, а не
материальное происхождение).
Для процесса постановки–решения задачи (как ситуации
определенного выбора) характерно наличие следующих четырех
компонентов:
- субъект, осуществляющий выбор;
- среда решения – принятые в качестве рабочих понятия, гипотезы,
законы, парадигмы и т.п.;
- доступные средства решения и практических действий;
- возможные результаты.
Типы информационных компонентов (сообщений ):
− фактографическая информация, фиксирующуая ситуацию (состояние
взаимодействия системы со средой) как результат преобразования;
− систематическую информацию, определяющую прагматические условия
(принципы, законы, критерии) применения преобразования и/или построения системы.
для систем управления информационными потоками (информационной
деятельности) – это метаинформация: тезаурусы, классификаторы и т.д.
24.Уровневая модель информационного взаимодействия "Пользователь - АИПС". Основные этапы (общая схема) поиска информации.
Начало поиска |
Формирование запроса |
Поиск |
Просмотр |
Оценка |
Удовлетворительно? |
Завершение поиска |
Реформулировка запроса |
да |
нет |
Первый уровень взаимодействия - это взаимодействие когнитивного уровня человека-оператора и поверхностного уровня компьютерной системы (интерфейса).
Второй уровень - взаимодействие когнитивного уровня человека-оператора и уровня процессов и задач.
Третий - взаимодействие пользователя с предоставляемой системой информацией; является самым сложным и практически не формализуемым уровнем общения.
Этапы поиска:
1) определение темы запроса, ее локализация в предметной области и формализация на уровне понятий основной и смежных областей, а также идентификация ресурса.
2)формирование, структурное и лексическое адаптирование выражения запроса, где система предоставляет вспомогательные информационные объекты (словари, тезаурусы, шаблоны и т. д.);
3)отбор документов с помощью одного из механизмов поиска по критерию, адекватному степени неопределенности информационной потребности, система предоставляет выбор механизма поиска или автоматически с помощью лексикографических словарей и проблемно-ориентированных тезаурусов нормирует и расширяет лексику запроса;
4)формирование и управление выдачей найденных документов, где система обеспечивает масштабирование пространства представления выданных документов, а также сортировку и рубрицирование или ранжирование по некоторому формальному критерию соответствия;
5)оценку результата поиска на уровне отдельного документа, где система обеспечивает возможность фиксировать значение степени соответствия запросу пользователя и использование лексики документов для непосредственной модификации выражения запроса;
6) итоговую оценку результатов поиска на уровне всего запроса или отдельных предложений с точки зрения принятия решения о завершении поискового процесса, где система позволяет количественно оценивать динамику выдач и обеспечивает возможность выборочного обращения к результатам отдельных этапов поиска или формирования проблемно-ориентированных словарей;
|
|
7) развитие процесса поиска по технологии реформулирования запроса по обратной связи по релевантности или использование каких-либо других ресурсов, например, ассоциированных БД вторичной или справочной информации, где роль системы - адекватное информирование о такого рода возможностях.