Газета.Ru в Telegram
Новые комментарии +

Трудности перевода: как нейросеть разжигает вражду

Палестинца арестовали из-за ошибки перевода Facebook

В Израиле после публикации в Facebook был арестован палестинский рабочий — он пожелал всем доброго утра, но после перевода нейросети безобидная фраза превратилась в призыв к разжиганию межнациональной розни. «Газета.Ru» вспоминала другие досадные ошибки машинного перевода, которые сеяли раздор между нациями.

Выпил кофе и в тюрьму

Житель Палестины Халавим Халави был арестован израильской полицией после того, как опубликовал запись в Facebook с пожеланием доброго утра на арабском, сообщает International Business Times.

Халави, на текущий момент работающий строителем, выложил свою фотографию на фоне бульдозера с чашкой кофе в руке и подписал ее: «с добрым утром». Снимок сделан в израильском поселении Бейтар-Илит, в котором и трудился Халави.

Автоматическая система перевода Facebook, работающая на базе нейросетей, перевела дружелюбную фразу на иврит и английский язык своеобразно — «напади на них » и «навреди им» соответственно.

Так как бульдозеры ранее использовались в террористических атаках, правоохранительные органы Израиля заинтересовались публикацией и задержали Халавима Халави по подозрению в подстрекательстве.

Как выяснилось, арабское простонародное выражение «всем доброго утра» и фраза «навреди им» различаются всего одной буквой, из-за чего нейросеть и допустила фатальную ошибку. Спустя несколько часов допроса полиция отпустила палестинца. Публикация, которая привела к аресту невиновного человека, более недоступна на Facebook.

В августе 2017 года Facebook объявила о том, что в социальную сеть был внедрен машинный перевод с помощью нейросетей, которые автоматически переводят контент сайта с одного языка на другой. Многие технологические компании, включая Microsoft и Google постепенно переключаются на подобную систему перевода и отказываются от традиционной машинной модели, что ускоряет и улучшает результат.

Тем не менее, перевод с помощью нейросетей пока далек от идеала и периодически выдает ошибки, которые вряд ли допустил бы человек.

Орки из Мордора

В прошлом году переводчик от Google тоже был замечен в неправильной интерпретации слов. Так, пользователи интернета обратили внимание на то, что при переводе с украинского языка слово «Россия» превращалось в «Мордор» — вымышленное владение сил зла из саги Джон Р. Р. Толкина «Властелин колец».

Кроме того, «россияне» стали «оккупантами», а фамилия министра иностранных дел Сергея Лаврова была переведена как «грустная лошадка».

Неожиданный перевод появился в системе на фоне ухудшения отношений между Российской Федерацией и Украиной после присоединения Крыма в 2014 году.

Google объяснила «трудности перевода» технической ошибкой, заявив, что перевод генерируется автоматически, используя сотни миллионов примеров из других текстов и документов, чтобы сделать перевод более релевантным. Компания добавила, что даже в похожих языках, как русский и украинский, система может давать сбои, так как значение слов зачастую зависит от контекста.

Тем не менее, официальная версия звучит не очень правдоподобно, так как пользователи имеют возможность предлагать свои варианты перевода, если им не понравится версия, предложенная машиной. В таком случае не исключена спланированная акция при участии людей, которые намеренно пытались «переучить» систему и заставить ее выдавать некорректный перевод.

Мат по-китайски

Не избежал порицания и сервис Skype, который осуществляет перевод на базе Microsoft Translator. Из-за несовершенства системы программа начала автоматически добавлять ругательства в перевод на китайский язык.

Фотограф Том Картер, который должен был участвовать в международной рекламе Skype, заявил о неудачном опыте общения с китайским мужчиной, который должен был помогать ему со съемкой.

Безобидная фраза «рад познакомиться» в интерпретации машинного перевода сохранила смысл, но добавила непонятно откуда взявшуюся обсценную лексику практически перед каждым отдельным словом.

Skype пришлось извиниться и сообщить, что переводчик находится в стадии бета-тестирования, поэтому качество перевода будет только улучшаться в дальнейшем. При этом не стоит забывать о том, что иероглифические языки — китайский, корейский или японский — сильно отличаются от языков, основанных на латинском алфавите, поэтому достичь точного перевода бывает трудно вне зависимости от мощности нейросети.

Новости и материалы
МЧС РФ назвало число жертв в ДТП с автобусом в Петербурге
Для упрощения выплат правительство создаст реестр нуждающихся граждан
Владельца затонувшего в Петербурге автобуса штрафовали за нарушения 23 раза
Власти сообщили о состоянии пострадавших при ДТП с утонувшим автобусом в Петербурге
В сухопутных войсках ВСУ рассказали, когда наступит критическая фаза конфликта
Депутаты ГД призвали устранить дефицит медработников
Мишустин назвал уровень госдолга в России одним из самых низких в мире
Зеленский подтвердил наступление ВС РФ на Харьков
Владельца упавшего в Мойку автобуса оштрафовали на ₽400 тысяч
Мишустин рассказал депутатам о росте доходов населения
Володин сравнил доходы России от сельского хозяйства и продаж оружия
Sony до конца весны объявит дату выхода God of War Ragnarok на ПК
Стало известно, что болезнь Лайма могла выйти из биолабораторий США
Для москвичей проезд до кладбищ на православные праздники сделают бесплатным
Украинский беспилотник сбили над Белгородской областью
В Новосибирске расселили жителей треснувшего дома
Зеленский раскритиковал западных союзников за медленное предоставление помощи
Выросло число погибших в ДТП с утонувшим автобусом в Петербурге
Все новости