Составление запросов для систем линейного поиска

Работа с линейными поисковыми системами подразумевает определенные навыки в составлении запроса. Традиционные языки запросов подразумевают выбор ключевых слов, указание на их обязательное наличие или отсутствие в текстах, положение ключевых слов относительно структуры текста (например, в заголовке или в самом теле документа) и относительно друг друга (расстояние между словами, последовательность употребления, жесткость словосочетаний, нахождение внутри одного предложения, одного документа и пр.).

В профессиональных системах линейного, или универсального, поиска возможности дополнительных параметров значительно расширены. Например, в системе «Гарант» реализована уникальная технология поиска через «Энциклопедию ситуаций». Пользователь формулирует запрос, используя привычные ему термины, система «переводит» запрос и в течение нескольких минут предоставляет ответ. В «Интег-руме» реализованы следующие уникальные возможности — поиск с опечатками или вариантами написания, поиск по фамилии, имени, отчеству, когда умная система находит в текстах все формы употребления фамилии, имени, отчества, которые могут соответствовать заданному, даже уменьшительные. Например, если вы ищете человека с фамилией Александров и инициалами А.Ю., то, задав эти параметры при поиске с включением нужной функции, получите документы, где упоминается Шурик Александров, Алексей Юрьевич Александров, Антон Александров, Александров Автандил Юлианович, А. Александров и т.д.

В материалах проекта «Гардарика» поисковикам рекомендуется составлять тезаурусы в зависимости от конкретных интересов и пополнять их постоянно, по мере выявления новых терминов в ходе работы. Более адекватной представляется структура тезауруса в виде семантических срезов, где для каждого основного термина отдельно строится таблица сопутствующих слов и слов шумовых (которые не должны встречаться в источнике). Это весьма актуально для журналистов, работающих по одной теме, но прежде всего этот совет относится к пользователям общедоступных поисковых систем. Профессиональные системы более специализированы и поэтому могут предложить пользователю готовые тезаурусы и типовые запросы.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: