Кого слушает президент

Из России — в Мордор

Почему Google Translate назвал Россию пристанищем Саурона

Алексей Короткин, Дмитрий Шестоперов 05.01.2016, 18:36
AnnaP-Artwork/Lotroplayers.com

Онлайн-переводчик Google Translate в очередной раз привлек к себе внимание пользователей и СМИ благодаря тому, что перевел «Российская Федерация» с украинского языка на русский как «Мордор». Это далеко не первый случай оскорбления чувств пользователей машинными алгоритмами. Отдел технологий «Газеты.Ru» разобрался в механике их возникновения.

Во вторник, 5 января, соцсети пестрили публикациями скриншотов, на которых Google Translate переводит словосочетание «Російська Федерація» с украинского на русский как «Мордор», а фамилию «Лавров» — «грустная лошадка».

В Google объяснили, почему Россия, по мнению сервиса-переводчика, вдруг превратилась в вымышленную страну и сосредоточие зла в Средиземье из легендариума Дж. Р.Р. Толкина. В компании заверили, что Google Translate — это автоматический переводчик, работающий без участия людей, но при помощи алгоритмов. Для создания наиболее качественного перевода алгоритмы анализируют огромные массивы документов и публикаций, как оригиналов, так и их переводов, сделанных людьми. О принципе работы переводчика Google подробно рассказывается в данном видео.

В случае если у Google Translate появляется грубая ошибка в переводе, то компания старается незамедлительно справиться с ней, рассказал представитель компании.

Что касается конкретно данной ошибки, из-за которой Россия стала Мордором, то в интернете можно найти множество статей, где «Мордор» и «Россия» используются в одном контексте. Здесь подразумевается и сомнительная теория, согласно которой в образе пристанища Саурона Дж. Р.Р. Толкин изобразил СССР, впоследствии же «титул» перешел к России.

Также тема стала широко обсуждаться, когда в Москве планировалось установить инсталляцию «Око Саурона». Что также вызвало широкий резонанс в СМИ. Журналист Леонид Бершидский в статье для Bloomberg, например, назвал Россию Мордором, а Украину — Широм, родиной хоббитов.

Фамилия «Лавров», наиболее часто упоминающаяся в публикациях СМИ о министре иностранных дел России Сергее Лаврове, могла получить столь странный перевод по схожей причине. Так, ранее в Запорожье был установлен памятник, который представляет российского государственного деятеля в образе лошади. Об этом писали украинские издания, что и привело к тому, что переводчик Google запутался именно в этих двух языках.

Таким образом, алгоритмы Google Translate просто-напросто сбились, анализируя украинские и российские источники. А на фоне обострившихся российско-украинских отношений подобные казусы привели к достаточно нелепым переводам.

Тем не менее сервисы Google уже не раз попадали впросак с использованием собственных алгоритмов.

Одним из самых громких роботизированных оскорблений Google стали запросы «nigger house» и «nigga house», которые выдавали в результатах поиска на Google Maps резиденцию президента США Барака Обамы в Вашингтоне. Причиной таких результатов поиска стала социальная сеть Google+, записи в которой использовались для нанесения и уточнения информации об объектах на картах. В большом количестве из них встречались эти словосочетания.

Поднятая волна критики в СМИ и со стороны обычных американских пользователей заставила компанию оперативно сделать заплатки в алгоритмы, и Белый дом перестал выводиться по этим запросам. Но внимательные пользователи на этом не остановились и нашли еще один запрос — «nigga king», который также указывал на резиденцию Барака Обамы.

Причиной ассоциации Белого дома с оскорбительными запросами стали пользователи Google+
Причиной ассоциации Белого дома с оскорбительными запросами стали пользователи Google+

Ранее Google пришлось закрыть функцию добавления пользователями объектов на Google Maps после того, как по определенным географическим координатам на них появилось изображение логотипа Android, справляющего малую нужду на логотип конкурента — Apple.

Этот «географический объект» был добавлен на Google Maps пользователями.
Этот «географический объект» был добавлен на Google Maps пользователями.

Таким образом, пользователи зачастую сами препятствуют развитию сервисов Google на основе пользовательского контента, и сторонние картографические сервисы, такие как созданная российскими разработчиками Wikimapia.org, получают преимущества на рынке перед таким гигантом, как Google.

Зачастую ляпы алгоритмов выглядят как шутки разработчиков или даже попытки «потроллить». Например, в начале 2010 года Google Translate переводил одну и ту же словесную конструкцию «is to blame» (англ. «виноват») по-разному в контексте России и российского президента и США и американского президента. Для России и Медведева перевод был «виноват», для США и Обамы — «не виноват». Позже различие в переводах в разном контексте было убрано.

В конце 2010 года появился знаменитый перевод фразы: «Доброе утро, Дмитрий Анатольевич!», которая в английском варианте у Google Translate превращалась в «Good morning, Mr President».

Иногда результат работы алгоритмов похож на шуточки разработчиков
Иногда результат работы алгоритмов похож на шуточки разработчиков

Версия с баловством разработчиков, конечно, имеет место быть, но за пять лет подобных случаев транснациональная корпорация, чьи миллиардные прибыли могут быть поставлены под угрозу подобными действиями сотрудников, должна была внести соответствующие изменения в работу с персоналом. Однако «шуточки алгоритмов» продолжают появляться с завидной регулярностью.

В декабре 2015 года Google Translate по-прежнему допускал «дискриминацию» в переводе в зависимости от контекста.

Так, «Россия присоединила» переводилось как «Russia joined», а «россия присоединила» (со строчной буквы «р») — как «Russia annexed», то есть «Россия аннексировала».

При этом для слова «Америка» в той же конструкции заглавная или строчная «а» значения не имела. Можно предположить, что те пользователи интернета, которые считали ситуацию с Крымом «аннексией», могли писать «россия» со строчной «р», выражая тем самым свое неуважение.

Также подобные различия в переводе «joined» в сервисе можно было наблюдать для Франции, Норвегии и Шотландии.

Еще одним уязвимым для действий пользователей сервисом является Google Street View. Google регулярно обновляет снимки городских улиц в разных городах, чтобы изменения местности отражались и в панорамах. Если сейчас курьезы и скандалы чаще связаны с местным колоритом и случайно попавшими на камеру сценами секса на улице, то постепенно сервис становится ареной для самовыражения пользователей и проявления определенной гражданской позиции. Так, австралийские женщины начали демонстрировать машинам Google обнаженную грудь как протест против вторжения корпорации в личную жизнь жителей.

Тем не менее в череде случайностей есть если не позитивные, то полезные примеры. В ноябре прошлого года благодаря Google Street View был обнаружен автомобиль с телом человека, считавшегося пропавшим без вести в течение девяти лет.