Меню
Главная
Авторизация/Регистрация
 
Главная arrow Информатика arrow Информационные технологии в государственном и муниципальном управлении
Посмотреть оригинал

Технологии машинного перевода текстов

Процессы экономической, научной, культурной и социальной интеграции оказывают существенное влияние на развитие управленческих технологий в России.

Необходимость учета информации, поступающей из зарубежных источников на иностранных языках, обусловила развитие технологий машинного перевода текстов с иностранного языка на русский и обратно.

Начало работ по машинному переводу текстов относится к концу 1940 — началу 1950-х гг. Теоретической основой этого периода работ был взгляд на язык как на кодовую систему. Датой рождения машинного перевода как исследовательской области считают март 1947 г., когда специалист по криптографии У. Уивер в письме Н. Винеру впервые поставил задачу машинного перевода, сравнив ее с задачей дешифровки. Фактически история машинного перевода начинается с «Джорджтаунского эксперимента», когда в 1954 г. состоялась первая публичная демонстрация машинного перевода с русского языка на английский, осуществленного на машине IBM-701. Это событие явилось толчком для начала работ по машинному переводу в СССР. В 1954 г. первый эксперимент по машинному переводу был осуществлен в Институте точной механики и вычислительной техники Академии наук СССР [13]. Становление направления во многом связано с работами А.А. Ляпунова, Ю.Д. Апресяна, О.С. Кулагиной, Ю.А. Моторина, РГ. Пиотровского и др.

Первые поколения систем машинного перевода подразделялись на два типа: Transfer и Interlingua. Технология Transfer основана на алгоритмах последовательного перевода «слово за словом», «фраза за фразой». Особое внимание в них отводилось построению машинных словарей. На технологии Transfer базировалось первое поколение систем машинного перевода. Технология Interlingua основана на создании некоего промежуточного языка, описывающего все структуры входного и выходного языков. Предложение на входном языке сначала анализируется в терминах промежуточного языка, а затем создается предложение на выходном языке. В связи с тем, что разработка промежуточного языка представляет сложность, технология Interlingua применяется реже, чем Transfer.

С конца 1970-х гг. новые достижения технической кибернетики и новые результаты теории и практики лингвистических исследований в автоматической обработке текстов привели к созданию новой технологии — Translation Мето?у (англ. — память перевода), основанной на использовании базы соответствий смысловых единиц, которая создается или пополняется, если есть готовая, перед началом работы. При переводе предложения или их части, отсутствующие в базе, не обрабатываются вообще, но зато те, что есть, переводятся всегда правильно. Применение технологии Translation Мето?у оправдано лишь для объемных текстов с многочисленными повторами, например технической документации, справочников и т.п. Большинство систем основаны на использовании баз соответствий, хотя могут сочетать в себе и элементы других технологий.

Машинный перевод, прошедший несколько стадий своего развития, в настоящее время сконцентрирован на идее моделирования действий человека-переводчика. Действующие системы машинного перевода ориентированы на конкретные пары языков (например, французский и русский или японский и английский) и используют, как правило, переводные соответствия либо на поверхностном уровне, либо на некотором промежуточном уровне между входным и выходным языками.

Качество перевода зависит от тематики и стиля исходного текста, количества дополнительных словарей. Перевод художественных текстов практически всегда оказывается неудовлетворительного качества. Для технических документов при наличии специализированных машинных словарей и некоторой настройке системы на особенности того или иного типа текстов возможно получение перевода приемлемого качества, который нуждается лишь в небольшой редакторской корректировке. Чем более формализован стиль исходного документа, тем лучшего качества перевода можно ожидать. Самых лучших результатов при использовании машинного перевода можно достичь для текстов, написанных в техническом (различные описания и руководства) и официально-деловом стиле. Наиболее популярными системами являются Promt, «Сократ» [34].

Машинный перевод можно использовать для поверхностного ознакомления с содержанием документа на незнакомом языке. В этом случае он может использоваться как сигнальная информация и не требует тщательного редактирования. Если документ представляет больший интерес, то необходимы тщательное редактирование и настройка системы перевода на определенную предметную область. Здесь играют роль полнота словаря, ориентированность его на содержание. Можно добиться улучшения качества перевода текста за счет подключения и изменения приоритета подключения словарей, встроенных в систему.

На практике машинный перевод становится экономически выгодным, если объем переводимых текстов достаточно велик (не менее нескольких десятков тысяч страниц в год), если тексты достаточно однородны, словари системы полны и допускают дальнейшее расширение, а программное обеспечение удобно для последующего редактирования. Системы машинного перевода используются в организациях, потребности которых в оперативных и качественных переводах достаточно велики. Машинный перевод — эффективное средство для просмотра и поиска информации на иностранном языке в сети Интернет.

 
Посмотреть оригинал
< Предыдущая   СОДЕРЖАНИЕ   Следующая >
 

Популярные страницы