Гипертекстовое представление информации
1. Для связи основных разделов и понятий в тексте используется гипертекст. Гипертекст позволяет структурировать документ путем выделения в нем слов-ссылок (гиперссылок). При активизации гиперссылки, например, щелчком мыши, происходит переход на фрагмент в тексте, заданный в ссылке.
Гиперссылка состоит из двух частей:
· указатель ссылки – это объект (фрагмент текста или рисунок), который визуально выделяется в документе (обычно синим цветом и подчеркиванием);
· адресная часть – название закладки в документе, на которую указывает ссылка (закладка – это элемент документа, которому присвоено уникальное имя).
Указателем ссылки и закладкой может быть фрагмент текста, графическое изображение, управляющий элемент.
Такая гипертекстовая структура используются в документах различных типов. В Интернете они образуют Всемирную паутину, связывающую Web-страницы на миллионах серверов в единое целое.
Компьютерные словари и системы машинного перевода текстов.
|
|
В настоящее время существуют тысячи словарей для перевода между сотнями языков (англо-русский, немецко-французский и другие), причем каждый из них может содержать десятки тысяч слов.
В бумажном варианте словарь – это толстая книга с большим количеством страниц, поиск в нем довольно трудоемкий процесс.
Компьютерные словари (например, Lingvo, «Контекст») тоже содержат перевод слов, но они предоставляют дополнительные возможности.
· Компьютерные словари в основном являются многоязычными, то есть дают пользователю возможность выбрать языки и направление перевода (например, англо-русский, испано-русский и другие).
· Кроме основного словаря общеупотребительных слов, часто они содержат десятки специализированных словарей по областям знаний (техника, медицина, информатика и другие).
· Они обеспечивают быстрый поиск словарных статей: «быстрый набор», когда в процессе набора слова возникает список похожих слов; доступ к часто используемым словам по закладкам; возможность ввода словосочетаний.
· Некоторые компьютерные словари предоставляют пользователю возможность прослушивания слов в исполнении дикторов, носителей языка, то есть являются мультимедийными.
Кроме того, существуют системы машинного перевода, позволяющие переводить не только отдельные слова и словосочетания, но и целый документ (текст) с высокой скоростью, и Web-страницу в режиме реального времени.
Лучшими среди российских систем машинного перевода считаются PROMT и «Сократ».
Системы машинного перевода осуществляют перевод текстов, основываясь на формальном «знании» языка (синтаксиса языка – правил построения предложений, правил словообразования) и использовании словарей. Программа-переводчик сначала анализирует текст на одном языке, а затем конструирует этот текст на другом языке.
|
|
Современные системы машинного перевода используются для перевода технической документации, деловой переписки и других специализированных текстов, но они неприменимы для перевода художественной литературы, так как им недоступны аллегории, метафоры и другие элементы художественного творчества человека.
Системы оптического распознавания документов.
Переход от бумажного документа к электронному состоит из двух этапов.
1. Сканирование. С помощью сканера получается изображение страницы текста в графическом файле.
2. Распознавание текста. Для преобразования элементов графического изображения в последовательности символов используются системы оптического распознавания символов.
Запустив такую систему, сначала надо распознать структуру размещения текста на странице: выделить колонки, таблицы, изображения и так далее. Далее текстовые фрагменты графического изображения страницы преобразовываются в текст.
Существует два метода распознавания: