Машинный перевод

Лекция 4

В отличие от ТМ-инструментов, которые лишь организационно помогают переводчикам, системы МП действительно порождают текст на языке перевода, а человек осущ-ет организацию работы комп-а и редактирование текста перевода.

Для достижения коммерчески оправданных результатов применение системы МП прежде всего необходимо обращаться к нему только тогда, когда это целесообразно.

На зачет* часто возникает необходимость принятия оперативного производственного решения по материалам большого текстового массива на ин. языке.

Современные системы МП работают примерно по такому же алгоритму, по которому в самых общих чертах работает и переводчик, но пер-к анализирует весь текст или его значительный фрагмент и анализирует и понимает широкий контекст, а отсутствие контекста порождает ошибки.

В технологии МП можно выделить критические аспекты, в которых вместе с тем существуют резервы повышения кач-ва МП. Прежде всего: если текст оригинала написан четким логичным стилем, если используются простые полные нераспространённые предложения, т.е. синтаксис текста перевода будет вполне удовлетворительным. В наше время большинство крупных фирм работают с учетом того, что их документация будет переводиться с помощью систем МП, т.е. док-ты готовят не разработчики и производители продукции, а квалифицированные лингвисты.

Просмотрев текст, направляемый на МП лингвист указывает приоритетный список словарей, которыми система должна пользоваться при переводе, при этом словари системы МП должны быть тщательно распределены по тематикам. В таких фирмах выработан свой собственный стиль с ограниченным кол-вом грамматических конструкций и словарем исключающим многозначность. При подготовке док-та важным критерием оценки языкового стиля док-та явл-ся оценка его переводимости именно той системой МП которой располагает данная фирма. На этом этапе учитываются возможные проблемы и предугадываются ошибки, которые могут быть устранены в процессе редактирования. Качество МП и рентабельность его систем значительно повышают 2 дополнительные технологические операции: предредактирование и постредактирование. Процесс предредактирования напоминает операцию перефразирования, кот. исп. пер-чик. Как правило крупные фирмы и предприятия издающие большие объемы сопроводительной док-ции заинтересованы в ее переводе сразу на несколько языков. Тщательная лингвистическая проработка и предредактирование исходного текста экономически целесообразны, поскольку позволяют повысить качество сразу нескольких переводов. Нельзя так же не учитывать тенденцию к формализации языка современной деловой коммуникации.

На современном этапе развития МП лидирующее положение занимают те системы, которые обеспечивают развитие лексических возможностей, располагают большим кол-вом подготовленных тематических словарей, обладают грамматическим обеспечением. Такие системы обеспечивают максимальное сохранение структуры и форматирования исходных док-ов и располагают возможностью одновременно использовать функции системы МП и ТМ-инструмента. Интеграция 2х функций в 1 технологии позволяет добиться синергетического (взаимодополняющее влияние систем – усилить преимущества, минимизировать недостатки) эффекта.

Итоги для зачета: в чем сходство и различие?

При МП машина переводит сама, при ТМ только записывает в базу данных. Сходство: позволяет автоматизировать процесс и что-то еще.

Почему соврем. Сис-ма МП можно максимально использовать? Потому что встроен ТМ.

Алгоритм работы МП.

Результаты перевода можно сохранять в БазеДанных и использовать в будущем, что значительно увеличивает скорость последующей работы. По мере пополнения БД повышается эффективность перевода, поскольку основная часть перевода подставляется из базы, а от пользователя требуется лишь корректировка тех фрагментов текста, которые были созданы с помощью автоматизированного перевода. Выделяются 4 основных этапа перевода док-тов.

1. Сегментация текста. Исходный текст разбивается на фрагменты в соответствии с заданными условиями. Самое типичное то, что заканчивается точкой либо точкой с запятой.

2. Перевод отдельных сегментов текста. По умолч. Любая сист. Настроена на 75% совпадений.

А. Выбор в базе данных. При обработке нового фрагмента текста система сравнивает его с хранящимися в Б ТМ-инструмента сегментами. При обнаружении идентичного или схожего сегмента его перевод отображается на экране с указанием совпадения в %. Сегменты, в которых % совпадения ниже указанного пользователем автоматически отправляются на МП.

Б. МП. Любой сегмент можно перевести в 2 случаях. 1. Если %совпадения между исходным сегментом и сегментом из базы меньше заданного. 2. Если перевод отсутствует в БД.

В. Ручной перевод. Пополнение базы переводов. Проверенные пользователем пары сегментов сохраняются в базе для дальнейшего использования.

Г. Результат перевода. Проверенные и отредактированные пользователем сегменты объединяются в текст перевода полным сохранением исходного форматирования.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: