Слушать новости
Телеграм: @gazetaru

Переведи меня не через Гугл

Андрей Десницкий о том, как он однажды выиграет хороший коньяк

Прослушать новость
Остановить прослушивание

Пару лет назад я заключил пари с приятелем на бутылку хорошего коньяка. Мы поспорили, что в ближайшие пять лет компьютеры не научатся переводить, как переводят люди. Я предложил простой критерий: взять несложный художественный текст и дать его перевести двум профессиональным переводчикам и машине. А потом дать трем людям определить, какой перевод делал компьютер. С моей точки зрения, все трое легко его угадают.

Остается еще три года, но я уверен, что выиграю пари. Что придает мне уверенности? Оппонент мне говорил: компьютерный перевод уже стал частью нашей реальности, мы пользуемся его плодами постоянно, зачастую смеемся над неуклюжими ошибками: к примеру, в меню в каком-нибудь восточном ресторане или в этикетке на китайском ширпотребе. Но это ведь первые, неуклюжие шаги, а скоро подключится сетевой интеллект. Компьютеры давно обыгрывают чемпиона-человека не только в шахматы, но и в игру го, в которой вариантов позиций, как говорят, больше, чем атомов во Вселенной. Неужели они не смогут перевести простенький рассказ или стишок?

Подобные ожидания — скоро машина заменит переводчика-человека — звучат с шестидесятых годов прошлого века. Но пока не заменила. Убедитесь сами, например, с помощью гугл-переводчика — пожалуй, самого распространенного и успешного в мире. Достаточно взять художественный текст и перевести его сначала на какой-нибудь далекий язык (не украинский и даже не английский), а потом получившийся результат перевести обратно. Будут ли смысловые потери?

Будут, да еще какие! Первую строфу «Бородина» Лермонтова я вбил в гугл-переводчик без разбивки на строки, чтобы они не считались отдельными предложениями. После перевода на японский и обратно вышло: «Дядя, разве не бессмысленно, что сожженная Москва отдана французам? Ведь драка была, но, более того, России нечего вспоминать о Бородинском дне!» Прямо скажем, общий смысл изменился на прямо противоположный. С китайским вышло не лучше: «Дядя, скажите, пожалуйста, отдана ли Франция, уничтоженная пожаром, французам? Ведь драки бывают, да, мол, еще! Недаром вся Россия помнит дни Бородина!» И даже французский отчасти промахивается: «Скажите, дядя, не зря ли сожженная огнем Москва была отдана французам? Ведь были бои, да, мол, чего еще можно желать! Недаром вся Россия помнит время Бородина!».

Любой русский читатель понимает, что «даром» в данном случае совсем не то же, что «бессмысленно» или «зря»: речь идет об огромных жертвах, мол, не даром Москва французам досталась, не просто так ее уступили. И, конечно же, отсылка тут не ко времени жизни композитора Бородина, а к дате Бородинского сражения, которое считается славной страницей истории. Как это нечего о нем вспоминать?

Но чемпион по несуразности, пожалуй, понятная любому носителю русского языка скороговорка «косил косой косой косой». Что тут долго думать? Некий человек, страдающий косоглазием, а может быть, даже заяц из сказки, косил траву, притом коса у него оказалась не прямой, а скошенной. Зайцам, поди, так удобнее. Иначе понять это невозможно. Что выдаст Гугл на английском? «Mowed with oblique oblique» – он правильно распознал только глагол, а все три слова «косой» перевел совершенно одинаково, как прилагательное. Ну, а из путешествия в Китай эта скороговорка возвращается в виде единственного слова «наклонный».

Почему теперь так плохо? Да очень просто. Для начала, рабочий язык гугл-переводчика — английский. По сути дела, все остальные пары языков переводятся через его посредничество. Поэтому, кстати, переводы с этого языка или на него получаются лучше прочих. Переводя с русского на китайский и обратно, программа два раза прогоняет текст через английский и по дороге легко утрачивает, к примеру, различия между «ты» и «вы».

Но главное препятствие в том, что машина принципиально не понимает смысла. На данный момент она сравнивает огромные объемы текстов, переведенных людьми, и устанавливает стандартные соответствия. На первом этапе она, упрощенно говоря, определяет, что самый частый эквивалент для русского прилагательного «косой» – английское «oblique». Ну и еще в программу вкладывают информацию, что сочетание букв «косой» может быть формой от существительного «коса», а у него, посмотрит программа в своем массиве данных, есть разные значения.

Далее программа учится эти значения различать. Если рядом со словом «коса» стоят слова «сено, деревня, мужики», то значение одно. Если слова «девушка, прическа, гребень» — другое. А если «река, песок, отмель» — третье. И в большинстве случаев этой информации достаточно, чтобы выбрать правильное значение. Но только не в том, который я привел выше!

А впрочем, не только в нем. Любое человеческое высказывание опирается не только на непосредственный контекст (слова и предложения, которые стоят рядом), но и на контекст культурно-исторический, на наши общие представления об окружающем мире. Компьютер их лишен начисто, формализовать их, по крайней мере, с имеющимися технологиями практически невозможно.

Что будет происходить дальше? Скорее всего, компьютеры окончательно вытеснят людей в том, что касается перевода технических или медицинских инструкций. В конечном счете, все они сводятся к ограниченному количеству вариантов, как в шахматах, например: принимать лекарство по две таблетки один раз в день или по одной три раза, до или после еды, запивать водой или рассасывать.

Но вот уже с юридическими текстами возникнет проблема, потому что они описывают отношения между людьми, которые едва ли могут быть исчерпывающим образом описаны с помощью ряда стандартных формул. Как сможет компьютер находить лазейки в законе или добавлять на двадцатой странице договора примечание мелким шрифтом, которое меняет весь смысл документа? А юристам деньги платят именно за это. И уж совсем трудно ожидать, что он распознает сарказм в речи адвоката, сумеет правильно перевести риторический вопрос, отличив его от реального.

Что же касается художественного перевода… не будем обманываться: часть того, что называют сегодня худлитом (но только, умоляю вас, не «художественной литературой», это совсем иное), и переводится сегодня через машину, а потом слегка причесывается человеком-редактором. И может быть, это даже сгодится для чтения в вагоне метро или в очереди к зубному врачу. Но те компьютеры, с которыми мы имеем дело сегодня, никогда не создадут ничего сравнимого с «Гамлетом» в переводе Пастернака или с «Алисой в стране чудес» в переводе Заходера.

Вы, может быть, скажете, что на самом деле это не совсем переводы, а скорее оригинальные литературные произведения, которые были созданы на тот же сюжет и с использованием сходных образов и выражений на другом языке. И может быть, вы будете даже по-своему правы, но я на это возражу, что таким и должен быть хороший перевод.

Но об этом мы поговорим в другой раз — когда я допью свой честно выигранный коньяк!