MACHINE TRANSLATION IN THE MODERN TRANSLATOLOGICAL PARADIGM

Рубрика конференции: Секция 17. Филологические науки
DOI статьи: 10.32743/NetherlandsConf.2023.8.34.362389
Библиографическое описание
Ткачева Ю.Г. MACHINE TRANSLATION IN THE MODERN TRANSLATOLOGICAL PARADIGM// Proceedings of the XXXIV International Multidisciplinary Conference «Innovations and Tendencies of State-of-Art Science». Mijnbestseller Nederland, Rotterdam, Nederland. 2023. DOI:10.32743/NetherlandsConf.2023.8.34.362389

MACHINE TRANSLATION IN THE MODERN TRANSLATOLOGICAL PARADIGM

Julia Tkacheva

Candidate of Pedagogical Sciences Associate Professor of Translation Studies Department Federal state-funded educational institution of higher education “Lugansk State Pedagogical University”,

Russia, Lugansk Peoples Republic, Lugansk

 

МАШИННЫЙ ПЕРЕВОД В СОВРЕМЕННОЙ ТРАНСЛОТОЛОГИЧЕСКОЙ ПАРАДИГМЕ

Ткачева Юлия Геннадиевна

доц. кафедры теории и практики перевода, Федеральное государственное бюджетное образовательное учреждение высшего образования «Луганский государственный педагогический университет»,

РФ, г. Луганск

 

Сегодня цифровизация и автоматизация формируют прочную основу жизни современного общества. Широкое использование компьютерных технологий в разных сферах человеческой деятельности, а также возрастающие объёмы научно-технической, общественно-политической, научно-популярной и других видов информации оказали существенное влияние и на переводческую практику. В этой связи применение классических подходов к реализации переводческого процесса не всегда является оправданным, поскольку требует существенных финансовых и временных ресурсов. Данная тенденция свидетельствует о целесообразности использования систем машинного перевода, преимущество которых заключается в оперативном переводе больших массивов разноплановой информации в предельно сжатые сроки и при минимальных затратах.

Актуальность данной статьи заключается в теоретическом анализе сущности переводческой деятельности в эпоху цифровизации и ее моделирования с опорой на современные компьютерные технологии.

Несмотря на противоречивость нашего мира, перевод все также выступает как интегративный фактор, направленный на преодоление языковых барьеров, обмен знаниями и опытом, разрешение разногласий и конфликтов между странами.

Цифровые технологии стали неотъемлемой частью традиционной модели переводческой деятельности и получили широкое применение в области как письменного, так и устного перевода. Тенденция к автоматизации переводческой практики стала результатом оптимизации некоторых ее аспектов, однако, основная нагрузка, заключающаяся в корректировке, редактировании, компенсации недостающих элементов, подборе соответствующих аналогов для культурно-маркированной лексики также лежит на переводчике.

Машинный перевод (англ. “Machine Translation”) иногда обозначается аббревиатурой МП (англ. “MT”) и в узком смысле означает попытку автоматизации процесса перевода с одного естественного языка на другой или отдельной его части. В основу данного процесса положен принцип ввода текста-оригинала без включения какой-либо сопровождающей информации или дополнительных данных в компьютерную программу с целью его дальнейшей обработки, в результате чего генерируется перевод исходного текста на другой язык. Принципиальным отличием МП от других видов перевода является полное отсутствие вмешательства человека.

Машинный перевод в широком смысле – это область научных исследований, которая включает последние достижения в области лингвистики, математики, кибернетики, и которые ставят перед собой цель построения систем, позволяющих реализовать процесс эквивалентного и адекватного перевода с одного языка на другой [2, с. 22].

Внедрение машинного перевода в область переводческой деятельности внесло определенные коррективы и в переводческий процесс в целом. Классический процесс перевода осуществляется, как правило, по схеме «источник – переводчик – реципиент», а с использованием МП процесс несколько усложняется – «источник – машинный перевод – переводчик – реципиент». Расширение цепи процесса перевода повлияло на смещение фокуса в деятельности самого переводчика: специалист теперь работает не только с оригиналом, даже в большей степени не с ним, а с результатом деятельности компьютерной программы и осуществляет не сам процесс перевода, а занимается его постредактированием.

Отправной точкой развития машинного перевода в отдельную отрасль лингвистической науки можно назвать средину XX века. Идея создания систем МП была реализована по нескольким причинам. Во-первых, вначале 50-х гг. происходит настоящий информационный взрыв: огромное количество научно-технических трудов и периодики многократно превышают возможности переводчиков. Во-вторых, сильный импульс исследованиям в области машинного перевода дала «холодная война». Противостоящие общественно-политические блоки внимательно следили за развитием научно-технического потенциала друг друга. По этой причине многие первые зарубежные системы МП были разработаны для работы с русским языком [1, стр. 89].

В 1949 г. американский специалист по дешифровке У. Уивер впервые предпринял попытку теоретически обосновать принципиальную возможность создания систем машинного перевода и изложил свои идеи в Меморандуме о переводе ‒ первой концепции, основанной на формальном описании структурного сходства между языками. Впоследствии, отмечается появление групп разработчиков во многих институтах США (в Массачусетском технологическом институте – “MIT”, в Калифорнийском университете, в Национальном бюро стандартов в Лос-Анджелесе, в Техасском университете). Первая международная конференция на тему машинного перевода была организована в 1952 г., а в 1954 г. впервые был проведён Джорджтаунский эксперимент, суть которого заключалась в переводе текста с русского языка на английский. СССР под руководством О.С. Кулагиной и И.А. Мельчука в Институте прикладной математики АН СССР в 1955 г. был выполнен перевод на русский язык текстов по прикладной математике. В 1959 г. открывается Лаборатория машинного перевода в МГПИ-ИЯ им. М. Тореза (ныне Московский государственный лингвистический университет), в которой возникли идеи, во многом предвосхитившие дальнейшее развитие теории МП и в какой-то степени систем искусственного интеллекта ‒ концепция языка-посредника, понятие модели управления слова, роль словаря в МП и т. п. Серия публикаций этой лаборатории под общим названием «МП и ПЛ» (Машинный перевод и прикладная лингвистика), оказала существенное влияние не только на прикладную, но и на теоретическую лингвистику [1, с. 89 – 90].

Первые версии программ машинного перевода основывались на подробных двуязычных словарях, и предлагали ряд эквивалентных слов на языке перевода для каждого слова на языке оригинала, а также ряд правил в отношении порядка слов. Сложность задачи требовала совершенствования программы ввиду необходимости более систематического синтаксического подхода. Достижения лингвистики, особенно в области разработки трансформационных генеративных грамматических моделей, открывали новые возможности для машинного перевода, что нашло отражение во многих трудах и проектах, посвященных МП.

Второй этап развития систем машинного перевода приходится на 70-е годы ХХ века. В этот период внутреннее устройство компьютером стало более совершенным и позволило выстраивать свои, основанные на правилах переводящего языка синтаксические структуры, для каждого отдельного предложения, вместо дословного перевода отдельных языковых единиц.

Начало 1990-х гг. ознаменовалось прорывными изменениями в машинном переводе с радикальным изменением стратегии процесса перевода с перевода, основанного на грамматических правилах, на перевод, основанный на массивах текстов и примерах (например, программа «Reverso»). Язык перестал восприниматься как статичная сущность, управляемая фиксированными правилами, а наоборот начал рассматриваться как динамичный корпус, способный меняться в зависимости от использования, эволюционируя с течением времени и адаптируясь к социальным и культурным реалиям. В конце ХХ века, благодаря развитию компьютерных технологий и прикладной лингвистики возник статистический подход к машинному переводу, основанный не на формальных правилах языка, а на статистике использования языковых единиц при сравнении сотен тысяч параллельных тексов, содержащих примерно одинаковую информацию, на разных языках.

Основным преимуществом статистических систем является их способность коррелировать с учётом подвижности языка, что в свою очередь сопряжено с непрерывным развитием лексической системы языка, и параллельным «обрастанием» новых компонентов системы специфическими и уникальными смыслами и семантическими связями. Таким образом, если в языке происходят какие-либо изменения, система сразу это распознает и самостоятельно обучается [3, c. 157]. У данной системы есть и свои минусы: необходимость в повышении количества объёмных текстов, которые требуют постоянного обновления, а также отсутствие чувствительности к глубинной структуре текста. Следовательно, в выходном тексте может содержаться большое количество разноплановых ошибок. Достоинством статистического подхода является способность запоминать и переводить короткие фразы и редкие слова. Однако, есть и недостаток – в результате может отсутствовать взаимосвязь между фразами, так как при переводе не учитывается контекст.

Статистический подход основан на моделях языка и перевода: система сравнивает сотни тысяч параллельных текстов, одинаковых по смыслу, но написанных на разных языках. Результат сравнения записывает в матрицу выравнивания слов. Матрица помогает определить, какие пары фраз в паре предложений могут служить переводами друг для друга. Для создания модели языка система изучает тексты на одном языке и составляет списки всех употребляемых слов и фраз. Каждому слову и фразе соответствует свой числовой идентификатор, определяющий их рекуррентность.

В настоящее время существуют и развиваются высококачественные системы машинного перевода, на помощь которым приходят новые информационные технологии и корпусная лингвистика, но, несмотря на это, до сих пор существует ряд проблем для решения задач, стоящих перед искусственным интеллектом. Например, одной из главных сложностей машинного перевода является принципиальная неоднозначность языка.

В последние годы технологии машинного перевода претерпели значительные положительные изменения благодаря исследованиям “Google” по нейронному машинному переводу, которые прогнозируют оптимистичное будущее для данной отрасли. Нейронный машинный перевод (“Neural Machine Translation – NMT”) является перспективным и многообещающим подходом, который способен устранить многие недостатки традиционных систем машинного перевода. Стоит отметить, что концептуальным «предком» нейронного перевода является статистический машинный перевод, который был доминирующей парадигмой перевода на протяжении нескольких десятилетий [4, с. 54]. Нейронный машинный перевод – это подход к машинному переводу, в котором используется большая искусственная нейронная сеть. Он отличается от методов машинного перевода, основанных на статистике фраз, которые используют отдельно разработанные подкомпоненты. Сервисы перевода компаний “Google”, «Яндекс», “Microsoft” и “PROMT” уже используют нейронный перевод. Более того, стоит разграничивать такие виды перевода как автоматизированный перевод (англ. «Computer-Aided Translation» или англ. «Machine-Aided Human Translation»), который осуществляется человеком с применением программного обеспечения, например, электронных словарей, лингвистических корпусов и т.п., и который значительно облегчает некоторые аспекты процесса перевода; и интерактивный (адаптивный) перевод (англ. “interactive translation”). Интерактивный подход реализуется благодаря вспомогательной роли программы, когда переводчик остаётся ответственным за написание перевода, а система подбирает наиболее подходящие соответствия путём внесения предложений по мере того, как специалист пишет свой перевод. Этот способ построен по подобию функции автозаполнения [6].

В основе перевода, выполняемого специалистами, лежат основные когнитивные процессы, выполняемые человеческим разумом. Суть процесса перевода заключается в полном понимании смысла и содержания текста на исходящем языке с учетом всех лингвистических уровней: семантического (понимание слов вне контекста), синтаксического (понимание слов внутри контекста), прагматического (понимание ситуации контекста), – и применение всех переводческих умений, знаний и навыков: знание языка оригинала, знание языка перевода, знание эквивалентов между исходящим и целевым языками, знание предметной области, а также обширные фоновые знания, знание социокультурных аспектов, т. е. обычаев и условностей исходной и целевой культур [5, с. 6]. Современный машинный перевод нацелен на подражание функционированию человеческого мозга.

Создатели систем МП предполагали, что данный вид перевода должен одинаково хорошо справляться с различными типами текстов, начиная от научно-технических и вплоть до художественных и даже поэзии. Однако, длительное использование таких систем доказало невозможность данного предположения по двум группам причин: лингвистическим и экстралингвистическим. Первая группа возникла по причине недостаточности знаний и системе функционирования языка, которая и являлась базисом программ машинного перевода. Проблема создания компьютерных моделей анализа и синтеза словосочетаний, высказываний, предложений и текстов была недостаточно разработана и теоретически обоснована. Ко второй группе причин можно отнести осознание того факта, что процесс понимания – важнейшая составляющая естественного перевода – далеко не обеспечивается чисто лингвистическим анализом речевого сообщения. Понимание основывается на знаниях адресата, его способности делать выводы и умозаключения, кроме того, понимание связано с коммуникативной установкой адресата в конкретной ситуации общения и т. д. [1, с. 90].

Дальнейшее развитие систем МП для многих IT-специалистов стало принципиальным, поскольку компьютерное моделирование процесса перевода обладает особой сложностью и комплексностью. Программистам предстоит создать такую многоуровневую систему перевода, которая бы смогла взаимодействовать со всеми уровнями языка: начиная от распознавания всех возможных графем при письменном, и фонем при устном переводе до передачи не только смысла высказывания, но и решения всех экстралингвистических задач, включая передачу культурологического аспекта, эмоциональной окраски, всех семантических и стилистических особенностей конкретного отрезка речевой деятельности человека. Цель систем МП заключается в обеспечении передачи трансформационных, эквивалентных и вариантных переводческих соответствий. Более того, переводчик может воспользоваться отдельными системами машинного перевода, которые обладают такой функциональностью, как перевод в пределах трёх и более языков. В настоящее время такие программы носят экспериментальный характер.

Машинный перевод продолжает развиваться. Крупные компании теперь используют его чаще, также растет спрос на увеличение продаж программного обеспечения. Результатом данных тенденций стало создание онлайновых служб машинного перевода, которые предлагают быстрые услуги электронной почты, веб-страницы и т.д. на желаемом языке, а также доступность многоязычных словарей, энциклопедий и бесплатных терминологических баз данных с прямым доступом.

Кроме того, для подобного вида перевода характерна обратная связь и возможность сразу проверить теоретическую гипотезу об устройстве тех или иных языковых уровней и эффективности предлагаемых алгоритмов. Данная характерная черта перевода в целом и машинного перевода в частности привлекает внимание теоретиков, в результате чего продолжают возникать все новые теории автоматизации перевода и формализации языковых данных и процессов. Основным же стимулом для непрекращающихся исследований стала социальная необходимость в передаче большого количества информации на разные языки, а также необходимость лингвистического обеспечения межъязыковой коммуникации в любое время и в любом месте.

Другие способы преодоления языковых барьеров на пути межкультурной коммуникации, такие как разработка или принятие единого языка, а также изучение иностранных языков – не могут сравниться с переводом по эффективности. В этой связи можно утверждать, что альтернативы адекватному и альтернативному переводу не существует, поэтому разработка качественных и высокопроизводительных систем машинного перевода может способствовать разрешению важнейших социально-коммуникативных задач.

Следует отметить, что МП обладает целым рядом преимуществ. Прежде всего, благодаря технологиям МП возрастает скорость выполнения перевода, а стоимость заметно снижается. Прибегая к услугам профессиональных переводчиков, можно получить качественный перевод, однако, за более высокую цену и с большими временными затратами. Другим важным преимуществом МП можно назвать приватность и конфиденциальность перевода, так необходимые при переводе личных писем, переписки, финансовой документации и т.п. Профессиональный переводчик, как правило, имеет специализацию по переводу текстов определённой тематики, однако программа-переводчик имеет ряд преимуществ и может справиться с переводом текстов из самых разных областей: для правильного перевода специализированных терминов достаточно подключить необходимые настройки, что также свидетельствует об исключительной универсальности, гибкости и скорости выполнения.

Известно, что машинный перевод требует от переводчика последующего редактирования текста, и как правило, переводчики вносят соответствующие правки. Несмотря на все очевидные преимущества, машинный перевод имеет множество недостатков и проблем, как с технической, так и с лингвистической точки зрения. Сомнения вызывают многие аспекты компьютерного перевода: культурологические, смысловые и контекстуальные неточности, ошибки в грамматике, словоупотреблении, стилистике, пунктуации и синтаксисе получившегося сообщения, высказывания или текста.

Учитывая сложность явлений, лежащих в основе работы переводчика-человека, было бы абсурдно утверждать, что машина может выдавать прагматические адекватный текст того же качества, что и человек. Однако ясно, что даже переводчик-человек редко способен произвести высококачественный перевод с первой попытки. На самом деле, процесс перевода состоит из двух этапов: во-первых, подготовка чернового текста или предварительной версии на языке перевода, на котором решается большинство проблем перевода, но который далёк от совершенства; и, во-вторых, этап пересмотра, варьирующийся от простого перечитывания текста с внесением незначительных корректив до внедрения радикальных изменений.

Таким образом, можно сказать, что MП нацелен на выполнение первого этапа этого процесса автоматическим способом, чтобы переводчик-человек мог затем перейти непосредственно ко второму этапу, выполняя скрупулёзную и требовательную задачу редактирования. Проблема в том, что переводчик теперь сталкивается с текстом, который был переведён не человеческим мозгом, а машиной, что меняет требуемый подход, и природа совершения ошибок разная. Возрастает необходимость согласования машинной версии с человеческими мыслительными процессами, суждениями и опытом. Машинный перевод является одновременно и подспорьем, и ловушкой для переводчиков: подспорьем, потому что он завершает первый этап перевода; ловушкой, потому что переводчику не всегда легко сохранять необходимую критическую дистанцию от текста, который, по крайней мере, частично, уже переведен. Однако некоторые ошибки могут остаться незамеченными, и в таком случае следует отметить, что перевод, произведённый автоматически с помощью систем МП, не должен считаться окончательным, даже если на первый взгляд он кажется последовательным и правильным.

 

Список литературы:

  1. Баранов А.Н. Введение в прикладную лингвистику : учебное пособие. М. : Эдиториал УРСС, 2001. – 360 с.
  2. Головко Д.Р. Особенности и виды машинного перевода // Вестник Московского информационно-технологического университета; Московский архитектурно-строительный институт. – 2020. – №4. – С.24–30. URL:https://cyberleninka.ru/article/n/osobennosti-i-vidy-mashinnogo-perevoda (дата обращения: 01.08.2023).
  3. Дроздова К.А. Машинный перевод: история, классификация, методы // Вестник Омского государственного педагогического университета. Гуманитарные исследования. – 2015. – №3(7). – С. 156–158. URL: https://cyberleninka.ru/article/n/mashinnyy-perevod-istoriya-klassifikatsiyametody (дата обращения: 28.07.2023).
  4. Янбекова Г.Б. Эволюция машинного перевода / Г.Б. Янбекова, З.В. Галимзянова, Ф.Б. Ситдикова // Научные революции: сущность и роль в развитии науки и техники : сборник статей по итогам Международной научно-практической конференции. – Уфа, 2018. – С. 53–58.
  5. Craciunescu O. (2004). Machine Translation and Computer-Assisted Translation; a New Way of Translating?" // Translation Journal. Vol. 8. No.3. URL: www3.uji.es/~aferna/EA0921/7a.Pdf
  6. Knowles R., Koehn P. (2016). “Neural Interactive Translation Prediction.” Conference of the Association for Machine Translation in the Americas.