Когда можно использовать машинный перевод

от | Апр 5, 2023 | для клиентов | Нет комментариев

Живые переводчики часто обсуждают или правильнее сказать осуждают машинный перевод. «Эти кремниевые товарищи нам вовсе не товарищи!» — слышится глас возмущения переводчика-луддита.

А что если посмотреть на этот вопрос с позитивной точки зрения? Машинный перевод быстрее и доступнее, хоть и уступает в точности профессиональному переводу.

Давайте узнаем, когда все-таки можно использовать машину, а когда лучше доверить задачу живому переводчику.

Когда можно использовать машинный перевод

Какие тексты машинный переводчик переводит лучше всего?

На сегодняшний день машинные переводчики неплохо справляются с рядом задач, в частности:

  • Перевод больших объемов текста, когда скорость важнее качества или когда нет возможности или необходимости заказывать профессиональный перевод.

Если вы используете Google Translate, Яндекс Переводчик или DeepL, вы наверняка сталкивались с ограничениями по объему переводимого текста. Если вам необходимо быстро перевести большой документ с помощью машинного переводчика, вы можете использовать такие платформы как MateCat или Smartcat.

  • Перевод хорошо структурированных, относительно простых текстов, содержащих стандартизированную лексику.

Например, с помощью машины можно перевести инструкции к бытовой технике для личного пользования, стандартные юридические документы для беглого ознакомления, или отчеты и исследования международных организаций (опять же в целях ознакомления, не для публикации). В общем, все те документы, аналоги которых есть в открытом доступе на двух языках и перевод которых ранее выполняли профессиональные переводчики. Именно такие «параллельные» тексты используются для обучения языковых моделей.

Один из инструментов, который использует параллельные тексты, называется Context Reverso. В нем по небольшой фразе можно найти отрывки текста из переводов официальных документов ООН и других международных организаций, из книг, журналов, технической документации. Но, конечно, использовать такой инструмент нужно с осторожностью, так как в массиве данных иногда встречаются ошибки.  

  • Перевод текстов общей тематики, например, рабочей переписки, комментариев в соцсетях или сообщений в мессенджерах, когда нужно понять общий смысл без языковых изысков.

 Вкратце, с помощью машинного переводчика можно и нужно переводить те тексты, для которых цена ошибки невелика — когда неверный перевод не приведет к финансовым и репутационным потерям, травмам или гибели человека.

С какими текстами машины справляются плохо?

  • Перевод текстов, содержащих новые термины или узкоспециализированную лексику. Вероятность ошибочного перевода в этом случае возрастает из-за недостаточного количества достоверно переведенных параллельных текстов для обучения нейронной сети.
  • Перевод сканированных документов. Перед переводом такие документы нужно не просто распознать, но и проверить на наличие ошибок. В зависимости от качества исходного документа и типа программы по распознанию текстов может потребоваться серьезная проверка до начала перевода. Наличие ошибок распознавания, таких как случайные знаки переноса строки или разбивки страницы, артефакты (черточки, лишние знаки препинания, буквы разного регистра) введет машинного переводчика в ступор.
  • Перевод презентаций. Для презентаций характерен лаконичный стиль подачи материала. Огромный смысловой пласт остается «недосказанным», так как на слайде отображается только ключевая информация. Машинный переводчик не может «понять» контекст и выдать емкий смысловой перевод. Кроме того, в презентациях могут быть изображения с нередактируемым текстом, который машина перевести не сможет без предварительного распознания.
  • Перевод субтитров для фильмов и сериалов. Машины также плохо справляются с живой динамичной речью, пестрящей метафорами, гиперболами, иронией и прочими языковыми средствами выразительности.
  • Перевод текстов, где важна не только точность, но и стиль, тон и эмоциональная окраска, как, например, при переводе художественной литературы или рекламных текстов. Например, для качественного перевода рекламных материалов требуется полностью переосмыслить текст и воссоздать его заново с учетом местного менталитета и особенностей целевой аудитории. Переводческие решения в этом случае базируются больше на языковой интуиции, насмотренности, начитанности переводчика и его культурологических знаниях. Как вы уже догадались, машина на такой перевод не способна, какое бы число входных параметров не было задано для обучения нейросети.

Какие машинные переводчики лучше всего справляются с переводом в паре английский-русский?

Комплексного исследования эффективности работы разных переводчиков мне найти не удалось. Разве что на сайте VC есть обзор работы машинных переводчиков похожего формата. Для наглядности мы можем попробовать перевести небольшой отрывок текста разными машинными переводчиками и сравнить результат. Пусть выборка будет небольшая, но хоть какой-то базовый вывод мы сделать сможем.

Я перевел небольшой текст с помощью пяти широко известных сервисов машинного перевода: DeepL, Google, Microsoft, Яндекс и ROMPT. Все варианты перевода позволяют понять общий смысл, но каждый из них по-своему неточен, либо упускает важные детали, либо просто звучит слишком дословно.

Для примера я взял отзыв о работе машинного переводчика Lingvanex, опубликованный на их сайте.

 No matter what you ask Lingvanex to translate, it seems to cope and produce fully exportable natural-sounding translations surprisingly quickly given the complexities of the process – especially when there are complex sentences.

Вот какие варианты предложили разные переводчики:

Варианты перевода от разных машинных переводчиков

Самый плохой перевод выдал ROMPT:

Независимо от того, что вы просите Lingvanex перевести, он, кажется, справиться и производить полностью экспортируемые естественно-звучащие переводы удивительно быстро учитывая сложности процесса — особенно когда есть сложные предложения.

Видимо он все еще базируется на статистической модели. Детально разбирать этот перевод мы не будем.

Выделим основные отличия в переводе отдельных частей этого предложения в зависимости от платформы. 

Для вводной части «No matter what you ask Lingvanex to translate« было два основных варианта:

  • Что бы вы ни попросили Lingvanex перевести.
  • Независимо от того, что вы попросите Lingvanex перевести.

Первый вариант проще, лаконичнее и больше похож на то, как бы эту мысль выразил живой человек.

  • С фразой «it seems to cope» вышел конфуз. В данном случае автор отзыва выражает свое субъективное мнение и при этом немного сомневается в том, что машинный переводчик действительно справляется. Лучшим вариантом было бы сказать: «По-видимому, он справляется». Ligvanex и DeepL просто проигнорировали эту часть. Их перевод звучит утвердительно – переводчик справляется. Перевод от Гугла не упустил этот момент и выдал следующее — «он, кажется, справляется», хотя наречие «кажется» отражает большую степень сомнения, чем «по-видимому». Переводчики от Microsoft и Яндекса только усилили этот эффект за счет немного другой конструкции «кажется, что он справляется».
  • С «fully exportable» нужно разбираться отдельно и изучать контекст. Допустим, что имеется в виду возможность экспортировать результат перевода в другую программную среду. Тут все переводчики выдали один вариант — «полностью экспортируемые».
  • Для слова produce переводчики выдали три варианта: создает, производит, выдает. По моему мнению, здесь лучше всего справился переводчик от Яндекса — «выдает» звучит более естественно.
  • К вопросу о естественности, тут тоже есть отстающие и фавориты: Гугл переврал смысл — «естественные звуковые переводы», Ligvalex, DeepL и Яндекс выдали «переводы с естественным звучанием», а Microsoft постарался лучше и перевел эту фразу как «естественно звучащие переводы».
  • Опустим простую фразу surprisingly quickly и перейдем к последней части оригинального текста, которая, к слову, не блещет изяществом: given the complexities of the process – especially when there are complex sentences при переводе «complexities« и «complex« в русском языке возникает дублирование – «сложность процесса» и «сложные предложения». Машинные переводчики здесь переводят дословно, некоторые из них меняют пунктуацию, но избавиться от неблагозвучного повтора они не могут.

 А теперь для сравнения приведу возможный вариант живого смыслового перевода:

 Несмотря на сложность процесса, Lingvanex, повидимому, справляется с любым переводом и выдает легко экспортируемый, естественно звучащий результат на удивление быстро, даже в случае сложных предложений.

Здесь используются различные переводческие приемы, такие как генерализация и антонимичный перевод, перефразирование, разбивка и перестройка структуры предложения. 

  • «Что бы вы ни попросили Lingvanex перевести» становится «Lingvanex справляется с любым переводом»
  • Вместо «выдает перевод» — «выдает результат».
  • Неблагозвучную концовку разбили на две части и одну из них вынесли в начало предложения, чтобы повтор не так сильно бросался в глаза.

Какой вариант, на ваш взгляд, получился наиболее корректным и легким для восприятия? Поделитесь своим мнением в комментариях.

Если вам понравилась статья, поделитесь ей с друзьями или коллегами.

Также вы можете прочитать предыдущую статью с разбором машинного перевода: Давайте сравним машинный и человеческий перевод.

А если вам необходим качественный смысловой перевод документов, приложений или вебсайтов, вы можете связаться с нами через WhatsApp, чтобы обсудить детали.

 

Ахрамеев Семён

Ахрамеев Семён

Профессиональный англо-русский переводчик, генеральный директор ОсОО Translator.kg, председатель наблюдательного совета Союза переводчиков Кыргызстана.

К вашим услугам переводчик с более чем 15-летним опытом работы. Я сотрудничаю с крупными международными организациями, такими как IFRC, IREX, Mercy Corps, АКДН, Фонд Ага Хана, а также местными компаниями: Куликовский, Форестер, Металлопрокатный завод им. М.В. Фрунзе, Интергласс и т.д. Напишите или позвоните в WhatsApp, чтобы обсудить детали:

Shares
Share This
Задать вопрос
Есть вопросы? Ответим как можно скорее!
Здравствуйте! Чем могут помочь?