Повстанцы по-русски

Почему Google переводит английское слово 'rebels' в контексте пророссийских ополченцев как «боевики»

Дмитрий Евстифеев 08.08.2014, 17:46
ИТАР-ТАСС/ Зураб Джавахадзе

Корпорация Google исправляет ошибку, из-за которой интернет-переводчик компании называет пророссийских повстанцев боевиками. При этом английское слово 'rebels' в контексте других стран Google переводит как «повстанцы». После того как первоначальная ошибка была исправлена, пророссийские повстанцы превратились в мятежников.

Впервые любопытный алгоритм перевода выражения 'pro-Russia/pro-Russian rebels' (пророссийские повстанцы. — «Газета.Ru») заметили пользователи сети. Бесплатный онлайн-сервис Google Translate по-разному переводил эту фразу в зависимости от страны, которую поддерживают повстанцы.

Так, например, выражения 'pro-America rebels' (проамериканские повстанцы), 'pro-Ukrain/pro-Ukrainian rebels' (проукраинские повстанцы) или же 'pro-Germany rebels' (пронемецкие повстанцы) переводились сервисом именно как «повстанцы», в то время как 'pro-Russia rebels' — как «пророссийские боевики».

Необходимо отметить, что 'rebel' с английского может переводиться по-разному в зависимости от контекста и носить негативную или нейтральную коннотацию. «Повстанец», «мятежник», «боевик», «бунтарь», «бунтовщик» — все это допустимые варианты перевода на русский язык.

Однако в свете нынешней политической ситуации интернет-пользователи иронично отметили это как предвзятость электронного переводчика.

«Газета.Ru» обратилась за разъяснениями в российское представительство Google. В пресс-службе компании сообщили, что это так называемый баг — ошибка в программе, приводящая к сбою алгоритмов, — над которым уже работают сотрудники компании.

«Когда нам становится известно о баге, мы тут же начинаем работать над его исправлением», — пояснили в пресс-службе. В компании не уточнили, сколько времени может занять такая работа.

В Google также напомнили, что это не первый случай, когда онлайн-сервис обвиняют в предвзятости и якобы политизированном переводе. Так, например, в 2010 году Google Translate по-разному «обвинял» Россию и США. Фразу 'to be to blame' — «быть виновным» — программа переводила в зависимости от субъекта обвинения: 'USA is to blame' — «США не виноваты»; 'Russia is to blame' — «Россия виновата»; 'Google is to blame' — «Google не виноват».

В связи с этим компания даже опубликовала разъяснение за авторством менеджера технических программ Google Михаила Дайчика.

«Обычные переводчики, как правило, преобразуют грамматические конструкции из одного языка в другой, исходя из жестко прописанных правил, — рассказал Дайчик. — У этого подхода есть свои преимущества и недостатки, к которым, в частности, можно отнести нечеловеческую сложность работы, требующейся для того, чтобы покрыть такими правилами все разнообразие языка».

Однако, говорит менеджер, Google использует иную систему перевода.

«Переводчик Google устроен принципиально иначе. У нас есть набор статистических эвристик, например «эта последовательность слов обычно переводится так», который дополнен рядом вспомогательных правил, обобщающих группы слов, — рассказывают в Google. — Изначально для обучения Google Translate мы взяли набор текстов, переведенных максимально близко к оригиналу. В дальнейшем для усовершенствования правил мы дали пользователям возможность присылать нам переводы тех фраз, которые переводчик перевел некорректно».

Таким образом, в компании указывают на то, что те или иные алгоритмы перевода могут появиться в том случае, если сами пользователи «подсказывают» переводчику, как правильно переводить ту или иную фразу.

Не исключено, что эта же система сработала и в случае с повстанцами.

На момент публикации баг был исправлен. Однако и теперь пророссийские 'rebels' стоят особняком — переводчик называет их «мятежниками», в то время как 'rebels' других стран по-прежнему переводятся как «повстанцы.»