Uploaded by Элина Курт-Суюн

Машинный перевод: проблемы и история

advertisement
Курт-Суюн Элина 1137
В конце 1950х, исследователи из Соединенных Штатов, России и
Восточной Европы , были убеждены в том, что высококачественный
машинный перевод научных и технологичных документов, возможен в
ближайшее время. После, обещанное было невозможным
десятилетие, Национальная Научная Академия Соедененныз Штатов
опубликовала часто цитируемый, но малочитаемый отчет о своем
консультативном комитет по автоматической обработке языка
Статья Консультативного Автоматически Обоаботанного Языка
рекомендует ресурсы, которые были израсходованы Машинным
Переводом, в качестве решения непосредственных практических
проблем и которые следует перенаправить на более
фундаментальные вопросы языка Обработка, на которую нужно будет
ответить, прежде чем можно будет построить какую-либо машину
перевода. Нумерация лабораторий работающих в этой области, было
резко сокращено во всем мире, и немногие могли быть допущеными к
финансированию для более долгосрочной поисковой программы,
которая в последующем стала известна как вычислительная
лингвистика.
В 1980-х годах возродился интерес к машинному переводу, и, хотя
подходы незначительно отличались от 1960-х годов, многие усилия,
особенно в Японии, быстро считались успешными. Выглядело так,
словно это имело меньше общего с достижениями в сфере
лингвистики и программной технологии ну или же с большим размером
и скоростью компьютеров, чем с лучшим признанием специальных
ситуаций где изобретательность может сделать ограниченный успех в
рудиментарном техническом переводе. Самыми видимыми примерами
были МЕТЕО системы, разработанные в Монреальском университете,
у которых имелись долго предоставляемые Французские переводы
погодных прогнозов, используемых авиакомпаниями, судоходными
компаниями и другими.
Некоторые производители оборудования обнаружили, что возможно в
значительной степени автоматически переводить руководства по
техническому обслуживанию, используемые внутри их организаций (а
не их клиентами), за счет того, что технические писатели используют
только определенные слова и только в строго предписанных
сочетаниях. Множество факторов обуславливают сложность
машинного перевода, включая многозначность слов.
ПОЧЕМУ МАШИННЫЙ ПЕРЕВОД ТЕКСТА- ЭТО СЛОЖНО?
Множество факторов влияют на сложность в машинном переводе,
включая слова с несколькими значениями, предложения с несколькими
грамматическими структурами, неопределенность в том, к чему
относится местоимение , а так же другие грамматические проблемы.
Но два общих недоразумения делают перевод легче, чем он есть, как
таковой.
Первое, перевод- не первостепенная лингвистическая операция.
Второе, перевод- это не операция, сохраняющая значение.
Вот старый пример, описывающий первую точку зрения, хорошо:
«Полиция отказала студентам в разрешении, так как они боялись
насилия»
Предположим, что это предложение должно быть переведено на
французский языка, в котором слово "полиция" имеет женский род.
Вероятно, местоимение "они" также должно быть женского рода.
Теперь заменим слово "боялись" на "поддерживали".
«Полиция отказала студентам
поддерживали насилие»
в
разрешении,
так
как
они
Теперь, внезапно, кажется, что местоимение "они" относится к
студентам, а не к полиции, и если слово "студенты" мужского рода, то
потребуется другой перевод. Знания, чтобы прийти к таким выводам,
не имеют ничего общего с лингвистикой. Это повседневные факты о
том, кто такие студенты, кто такая полиция, что такое насилие и в
какого вида отношения они могут вступать между собой.
Второй пункт, безусловно, связан с первым. Учитывая следующий
вопрос , написанный на французском языке: «Ou voulez-vous que je
me mette?» дословно, означающий : «Где вы хотите, чтобы я себя
поставил?» , что является довольно натуральным вопросом среди
семейства английских вопросов, наряду с: « Где Вы хотите чтобы я
сел/встал/оставил свою подпись/припарковался/пришвартовал свою
лодку?». В большинстве ситуаций, английское « Где ты хочешь
меня?» (дословно) будет отчасти приемлемо, но так же будет
приемлимо добавить или удалить, чтобы произвести беглый перевод.
Иногда этого не стоит избегать, так как существуют языки, такие как
Французский, в которых местоимение должно выражать число и род.
Японский наряду, местоимения опускает в целом. Русский язык не
имеет артиклей, Китайский, язык в котором глагол не выражает
множественное число и единственное, а так же настоящее и
прошедшее времена. Немецкий, язык, присущий гибкости порядка
слов, может оставить неопределенность в том. Что является
подлежащим, а что сказуемым.
Структура системы машинного перевода
Несмотря на то, что существует целый ряд вариантов, большинство
систем машинного перевода, те, что нашли практическое применение,
имеют компоненты, название которых можно найти на страницах
лингвистического учебника. Данные системы состоят из лексических,
морфологических, синтаксических и, возможно, семантических
компонентов — по одному на каждый из двух языков, для обработки
отдельных слов, сложных слов, предложений и их значений. Каждый
компонент передаёт информацию другому, пока последний в цепочке
не создаст абстрактное представление предложения.
Кроме того, существует компонент "передачи" — единственный
компонент, специализирующийся на определённой паре языков,
который конвертирует наиболее абстрактное представление
исходного текста в соответствующее абстрактное представление
текста на языке перевода. Из данного представления создаётся
предложение на языке перевода, созданное
путём обратного
аналитического анализа.
Некоторые системы используют так называемую "интерлингву", или
промежуточный язык. В этом случае этап передачи делятся на две
стадии: сначала осуществляется перевод исходного текста на
интерлингву, а после полученный результат преобразовывается в
абстрактное представление на языке перевода.
Download