На сайте используются cookies. Продолжая использовать сайт, вы принимаете условия
Ok
1 Подписывайтесь на Газету.Ru в MAX Все ключевые события — в нашем канале. Подписывайтесь!
Все новости
Новые материалы +

Трудности перевода: как нейросеть разжигает вражду

Палестинца арестовали из-за ошибки перевода Facebook

В Израиле после публикации в Facebook был арестован палестинский рабочий — он пожелал всем доброго утра, но после перевода нейросети безобидная фраза превратилась в призыв к разжиганию межнациональной розни. «Газета.Ru» вспоминала другие досадные ошибки машинного перевода, которые сеяли раздор между нациями.

Выпил кофе и в тюрьму

Житель Палестины Халавим Халави был арестован израильской полицией после того, как опубликовал запись в Facebook с пожеланием доброго утра на арабском, сообщает International Business Times.

Халави, на текущий момент работающий строителем, выложил свою фотографию на фоне бульдозера с чашкой кофе в руке и подписал ее: «с добрым утром». Снимок сделан в израильском поселении Бейтар-Илит, в котором и трудился Халави.

Автоматическая система перевода Facebook, работающая на базе нейросетей, перевела дружелюбную фразу на иврит и английский язык своеобразно — «напади на них » и «навреди им» соответственно.

Так как бульдозеры ранее использовались в террористических атаках, правоохранительные органы Израиля заинтересовались публикацией и задержали Халавима Халави по подозрению в подстрекательстве.

Как выяснилось, арабское простонародное выражение «всем доброго утра» и фраза «навреди им» различаются всего одной буквой, из-за чего нейросеть и допустила фатальную ошибку. Спустя несколько часов допроса полиция отпустила палестинца. Публикация, которая привела к аресту невиновного человека, более недоступна на Facebook.

В августе 2017 года Facebook объявила о том, что в социальную сеть был внедрен машинный перевод с помощью нейросетей, которые автоматически переводят контент сайта с одного языка на другой. Многие технологические компании, включая Microsoft и Google постепенно переключаются на подобную систему перевода и отказываются от традиционной машинной модели, что ускоряет и улучшает результат.

Тем не менее, перевод с помощью нейросетей пока далек от идеала и периодически выдает ошибки, которые вряд ли допустил бы человек.

Орки из Мордора

В прошлом году переводчик от Google тоже был замечен в неправильной интерпретации слов. Так, пользователи интернета обратили внимание на то, что при переводе с украинского языка слово «Россия» превращалось в «Мордор» — вымышленное владение сил зла из саги Джон Р. Р. Толкина «Властелин колец».

Кроме того, «россияне» стали «оккупантами», а фамилия министра иностранных дел Сергея Лаврова была переведена как «грустная лошадка».

Неожиданный перевод появился в системе на фоне ухудшения отношений между Российской Федерацией и Украиной после присоединения Крыма в 2014 году.

Google объяснила «трудности перевода» технической ошибкой, заявив, что перевод генерируется автоматически, используя сотни миллионов примеров из других текстов и документов, чтобы сделать перевод более релевантным. Компания добавила, что даже в похожих языках, как русский и украинский, система может давать сбои, так как значение слов зачастую зависит от контекста.

Тем не менее, официальная версия звучит не очень правдоподобно, так как пользователи имеют возможность предлагать свои варианты перевода, если им не понравится версия, предложенная машиной. В таком случае не исключена спланированная акция при участии людей, которые намеренно пытались «переучить» систему и заставить ее выдавать некорректный перевод.

Мат по-китайски

Не избежал порицания и сервис Skype, который осуществляет перевод на базе Microsoft Translator. Из-за несовершенства системы программа начала автоматически добавлять ругательства в перевод на китайский язык.

Фотограф Том Картер, который должен был участвовать в международной рекламе Skype, заявил о неудачном опыте общения с китайским мужчиной, который должен был помогать ему со съемкой.

Безобидная фраза «рад познакомиться» в интерпретации машинного перевода сохранила смысл, но добавила непонятно откуда взявшуюся обсценную лексику практически перед каждым отдельным словом.

Skype пришлось извиниться и сообщить, что переводчик находится в стадии бета-тестирования, поэтому качество перевода будет только улучшаться в дальнейшем. При этом не стоит забывать о том, что иероглифические языки — китайский, корейский или японский — сильно отличаются от языков, основанных на латинском алфавите, поэтому достичь точного перевода бывает трудно вне зависимости от мощности нейросети.

Новости и материалы
В Курской области украинский беспилотник атаковал гражданский автомобиль
Андреева названа лучшей теннисисткой России
Минобороны сообщило о перехвате более 50 БПЛА над территорией России
Жителей юга России предупредили об угрозе падения БПЛА
Орбан усомнился, что генсек НАТО сохранит свой пост после угроз России
Под Белгородом FPV-дрон ударил по «КамАЗу», есть раненый
FIDE проголосовала за снятие ограничений с российских шахматистов
«Не должен дожить до старости»: Кадыров ответил на слухи о проблемах со здоровьем
Названы дата и место прощания с погибшим мэром Реутова
«Работа — главный приоритет»: чиновники РФ рассказали об участии в воспитании детей
Мерц покинул переговоры делегаций США и Украины в Берлине
ВС РФ впервые с начала СВО ударили авиабомбами по Одесской области
Вице-премьер Италии заявил, что не хочет, чтобы итальянские дети воевали с Россией
В Сирии начали операцию против ИГ
«Я болею за вас»: американский чемпион Малинин обратился к российским фигуристам
В Пермском крае потерялись 13 туристов
Кадыров назвал бокс лучшим видом спорта
Кадыров рекомендовал жителям Чечни объяснять туристам, что те ведут себя вызывающе
Все новости