Правила их использования. Считается, что эта система понимает текст, если она может ответить на вопросы по этому тексту. При этом понимании ПК просто находит готовые ответы в своей базе знаний, ранее занесенные человеком. Таким образом, ПК уподобляется человеку.
Понимание-уподобление
Компьютерная система должна меть знания лишь о языке. Суть понимания сводится к тому, что ПК узнает морфологическую структуру каждого слова в предложении, проводит синтаксический анализ, узнает в исходном тексте ключевые слова, словосочетания и предложения
Понимание-узнавание
Знания о пользователе системы, желающем получить от ПК некоторое понимание, вложенного в его память текста
Правила использования знаний о фрагменте реальной действительности (предметной области)
Знания о реальном мире (предметной области)
Правила использования знаний о языке
Знания о языке, на котором написан текст
|
|
Типы автоматического понимания
Связано с выяснением семантических отношений между предложениями текста и с выявлением соответствующей тексту ситуации реальной действительности.
Гиперсинтаксический или прагматический
Семантический
Синтаксический
Морфологический
Путем анализа одного или нескольких разных текстов извлечь такие знания, которые можно поместить в некоторую базу знаний
Сравнить содержание двух разных текстов и выдать инфу, что в них общего и в чем различия
На основе анализа текста, написанного на одном языке, выдать адекватную информацию на другом
Приведенные в тексте сведения представить в другой форме (таблица, график)
Соотнося уровни понимания текста компом с основными уровнями языка, можно выделить следующие уровни автоматического понимания:
Морфологическое понимание сводится к автоматическому приписыванию каждому слову текста его морфологических признаков. Суть синтаксического понимания текста заключается в автоматическом выделении в каждом предложении текста главных и второстепенных членов предложения и установления между ними различных типов связи. В процессе семантического понимания текста автоматически устанавливаются значения, выделенные на синтаксическом уровне, составляющих предложение (подлежащее – одушевленное/неодушевленное, сказуемое – глагол движения/чувствования, обстоятельство – места/времени/действия)
|
|
Компьютерная система, понимающая письменный текст, должна иметь в своей базе данных следующую инфу:
В зависимости от сложности использования знаний и их количества различают следующие типы автоматического понимания:
Для очень узкой предметной области. ПК должен иметь:
- знания о языке
- правила их использования
- знания по предметной области
Считается, что система понимает текст, если она может определить какой объект или предмет, или событие предметной области соответствует отдельным фрагментам этого текста. Однако одним и тем же фрагментом текста могут соответствовать различные объекты или события. Поэтому соотносить их можно лишь с определенной степенью вероятности – отсюда термин «прогнозирование»