Кого слушает президент

«Мы движемся к связи виртуального и реального миров»

Интервью с руководителем управления качества поисковых продуктов «Яндекса» Андреем Стыскиным

Дмитрий Бевза, Алексей Короткин 14.03.2016, 17:10
Руслан Шамуков/ТАСС

Как московские таксисты помогают улучшить голосовой поиск, где интернет-пользователи ищут эротику, почему «Яндекс» не боится китайцев и чем он отличается от Google — «Газета.Ru» поговорила с Андреем Стыскиным, руководителем подразделения, отвечающего за качество поиска в «Яндексе».

— Сейчас все больше поисковых запросов происходит со смартфонов. Скажите, а чем вообще мобильный поиск отличается от классического поиска на ПК, если они вообще отличаются?

— Они, конечно, отличаются. В мобильном поиске на поведение пользователя накладывает отпечаток сложный ввод — на смартфоне не всегда удобно набирать текст, тем более на ходу. Еще одна особенность мобильного поиска — это большое количество неадаптированной для маленьких экранов информации в интернете. При этом пользователь поиска на мобильном хочет получить ответ на свой запрос быстро, желательно вообще не заходя на сайт.

Нужно понимать, что смартфон — персональное устройство. Он всегда с тобой, даже когда ты идешь по улице, и очень много сценариев мобильного поиска связано именно с его использованием вне помещений, с поиском на карте, с навигацией и пр. Структура запросов в мобильном поиске тоже немного другая.

Любопытный пример — так как смартфон обычно не использует никто другой, кроме его владельца, то доля запросов порно в мобильном поиске заметно выше, чем на десктопе.

Мобильный поиск также отличается от классического желанием пользователя получить иное, более утилитарное представление результатов поискового запроса. Над этим и работают сейчас и создатели сайтов, и поисковики.
Мы тоже этим занимаемся, например, активно инвестируем в голосовой ввод. Это вообще интересный опыт. Раньше это была тема из фантастических фильмов — герой что-то спрашивает, а робот или искусственный интеллект ему что-то отвечает. Но есть уже сценарии в реальной жизни, где это удобно реализовано. Различные голосовые помощники, появляются полностью роботизированные колл-центры, которые понимают голосовой запрос пользователя и отвечают ему тоже голосом. Например, на тех же «умных» телевизорах совершенно невозможно пультом напечатать что-нибудь, а дать голосовую команду — очень просто.

Андрей Стыскин
Андрей Стыскин

— Доля голосового ввода растет?

— Да, растет, но пока она далеко не доминирующая. Но, например, в «Яндекс.Навигаторе» голосом запросы о городских объектах или адресах вводят около трети пользователей. Мы отмечаем растущую долю голосовых запросов, например, среди таксистов.

— Да уж, мне как-то довелось наблюдать, как таксист из Средней Азии пытался произнести для навигатора «Грайвороновская улица»…

— Это же лучшие примеры для нас! Мы на таком потоке запросов и обучаемся. Записываем такие треки, ведь если у человека не получилось ввести запрос голосом, он его все равно напечатает, а мы точно узнаем, что вот этот голосовой фрагмент соответствует вот этому тексту, и в следующий раз распознаем речь лучше. У нас есть большая обучающая выборка, и мы с помощью нейросетевых технологий умеем обучать поисковую машину.
У нас много примеров голосовых треков совершенно разных пользователей. Кто-то говорит с акцентом, и поэтому «машинное» распознавание нужно дообучать.

— Вопрос по поводу расширенных сниппетов (сниппет — фрагмент информации с сайта, отражаемый в поисковой выдаче. — «Газета.Ru») в мобильной выдаче. Сайты на вас не обижаются? Ведь они старались, чтобы клик к ним был.

— Дело в том, что получение информации на мобильных устройствах часто осложняется плохим и медленным мобильным интернетом. Человек при этом хочет получить ответ на свой запрос как можно скорее, не тратя по несколько минут на переход по ссылке и загрузку страницы. Наша цель как поисковика — сделать так, чтобы пользователям, которые ищут информацию, было удобно.

Расширенный сниппет — это все же не статья и не полное содержимое страницы. Проблема переноса части информации с сайта в поисковый сниппет обсуждалась и ранее, но каких-то особых конфликтов с сайтами у нас никогда не было. Владельцы сайтов понимают, что ничего не выиграют, если пользователь кликнет по ссылке, перейдет на сайт, поймет, что это вообще не то, что он искал. Сайт лишь получит недовольного пользователя и дополнительную нагрузку в виде бесполезного трафика: такой случайный посетитель не читает тексты, не кликает по рекламе, не делится ссылкой в соцсетях и т.д.

Дата-центр «Яндекса»
Дата-центр «Яндекса»

— За последние года три голосовой поиск сделал гигантский шаг вперед, но вот поиск по изображениям и тем более поиск по видеофрагментам топчутся на месте и работают пока ужасно. С чем это связано?

— Голосовой поиск на самом деле эксплуатирует ровно тот же текстовый интерфейс взаимодействия с поиском. Речь просто научились хорошо распознавать и переводить голосовой запрос в текстовый. С картинками все принципиально сложнее, потому что долгое время никто не знал, как их переводить в понятный машине язык, кодировать то, что изображено на картинке. Но в последнее время наука очень сильно продвинулась в этом направлении, и связано это с развитием искусственного интеллекта, а точнее, нейронных сетей, которые позволили выделять универсальные «слова», описывающие изображения.

— В таком случае можно ли в ближайшие годы ожидать качественного улучшения поиска по картинкам и видео?

— Да, это на самом деле зависит от двух вещей — от дальнейшего усложнения нейронных сетей и от доступности аппаратных ресурсов, то есть серверов, которые нужны для их обучения. По видео, кстати, искать проще, чем по картинкам, потому что у видео, помимо собственно статичного изображения, есть еще звуковые дорожки и движение объектов в кадре. Для поиска это дополнительные сигналы. Так что если принципиально улучшить поиск по картинке, то видео — это просто задача масштабирования на большем объеме данных.

Некоторые поисковые сценарии в случае с картинками гораздо удобнее реализовать с помощью камеры смартфона.

Проще сфотографировать, например, букет цветов, отправить картинку в поисковый сервис, который ответит, что это за цветы или даже скажет, где их можно заказать.

Это все открывает принципиально новые возможности для взаимодействия с поисковой системой. Например, проезжаешь мимо билборда, видишь афишу концерта, наводишь фотокамеру, и тебя переадресовывают на сервис, где можно сразу заказать билеты. Потенциальные возможности тут огромные. Любая точка Москвы, Питера или другого крупного города уже «оцифрована» — кем-то когда-то сфотографирована с помощью смартфона и размещена в сети, и если научиться данные с таких фотоснимков использовать для обучения поисковой машины, то получится настоящая связь виртуального и реального миров. И мы движемся в эту сторону, в этом я вижу будущее.

— Раз мы заговорили про искусственный интеллект, в фантастике ИИ часто нападает на людей. Вспомнить те же «Матрицу» и «Терминатора». Но кажется, куда больше опасность, что умные машины нападут не на людей, а на их кошельки. Есть рекомендательные сервисы, платежные сервисы с автопополнением. Не потеряет ли потребитель контроль над своими финансами и своим выбором, все более доверяясь машинам?

— Конечно, новые возможности с развитием технологий несут и новые угрозы вообще в любой отрасли. Изобретение банковских карт и онлайн-сервисов стало причиной мошенничеств с деньгами в интернете, появились десятки способов украсть у человека пароли или подписать его на платные сервисы без его ведома.

Здесь важно, чтобы люди осознавали опасности и умели их избегать.

Когда мы идем по улице, мы понимаем, что переходить дорогу на красный свет опасно, а если чужой человек просит позвонить с вашего мобильного — возможно, у него что-то нехорошее на уме. То же самое и в интернете.

Макет дата-центра «Яндекса»
Макет дата-центра «Яндекса»

С развитием технологий развивается и технологическая грамотность людей, появляется некий базовый гигиенический минимум, когда человек и осознает возможные схемы мошенничеств в сети, и умеет определять опасные ресурсы.

— Не пришло ли время вводить какие-то этические критерии в механизм работы «Яндекса»? Эдакие «три закона робототехники» для контроля за действиями как искусственного интеллекта, так и пользователей?

— Мы давно занимаемся персонализацией поисковых ответов в зависимости от интересов пользователей, и польза от этой технологии осязаема. Например, человек, который покупает квартиру, сначала задает вопросы про новостройки, а потом начинает покупать в интернете материалы для ремонта. Используя эту информацию, можно понять его мотивы и рекомендовать какие-то выгодные для него предложения, контекстные текущим интересам. Подчеркну — нам для этого не нужно знать персональные данные человека, мы говорим не конкретно про него, а про группу лиц со схожими поисковыми интересами.

Вопрос про этические критерии вообще довольно сложный. Существует знаменитая байка про одну американскую розничную сеть, которая ни с того ни с сего начала автоматически присылать живущей по соседству с ее магазином 17-летней девушке рекламные предложения товаров для беременных. Ее отец возмутился и подал на сеть в суд. Пока шло разбирательство, выяснилось, что девушка действительно беременна. Просто алгоритм рекомендаций определил это по тому, какие покупки она совершала, и пришел к выводу, что поведение девушки — как у беременной.

— Существует распространенное мнение, что «Яндекс» лучше ищет на русском, Google — на английском, Baidu — на китайском. Вообще, есть ли различия в поисковых алгоритмах на разных языках?

— Мне трудно говорить про китайский, поскольку мы не измеряем качество поиска в Китае. Но в России в большинстве тематик мы, по нашим измерениям, лучше всех ищем на русском. Кстати, мы исследуем не только наш поток запросов, но и поток запросов по нашему конкуренту. Отмечу также, что у нас немного отличаются сами пользователи. Например, пользователи Google в среднем лучше знают английский язык, и у Google больше англоязычных запросов из России. Это просто специфика аудитории.

Сейчас куда больший вклад в развитие поисковых технологий и в конкуренцию вносит умение получать большой массив данных о пользовательских запросах, выделять из них полезные взаимосвязи, которые говорят об интересах в сети, и обучать с помощью этих взаимосвязей поисковую машину, которая в итоге учится точно понимать вопрос пользователя или решать его задачу. То есть сегодня главенствующую роль играет умение работать с большими данными, а не знание лингвистики или морфологии конкретного языка.

Мы можем за несколько месяцев сделать вполне качественный поиск почти на любом языке, а потом улучшать его, получая новые данные о поведении пользователей в конкретном регионе. Возможно, пока кроме иероглифического письма, так как там возникают сложности с разбиением запроса на отдельные слова.

— И тем не менее пока вы остановились на Турции. Почему?

— Изначально задача была разработать такой поисковый алгоритм, который на относительно небольшом количестве пользовательских данных, по сравнению с тем, что там есть у конкурента, мог бы качественно отвечать на большинство поисковых запросов. Мы эту задачу не с первого раза решили — после двух лет активного маркетинга мы отключили всю активность, связанную с продвижением, и в течение года перекраивали и перестраивали алгоритм. После этого доля рынка в Турции двинулась вверх — сейчас у «Яндекса» она составляет примерно 7% на десктопах.

Нюансов, связанных с региональной спецификой и пользовательскими предпочтениями, на самом деле очень много. Даже интерфейс турецкого «Яндекса» отличается от русского — мы обнаружили, что сайты, которые по дизайну выглядят, как yandex.ru, то есть содержат много разной информации — погоду, пробки, курсы валют, — туркам довольно трудно воспринимать, и нам пришлось менять интерфейс, размер и тип шрифта в поисковой выдаче.

Но вообще, главный успех в Турции — это «Яндекс.Навигатор». По нему весь Стамбул ездит, и до этого у горожан не было бесплатного инструмента, который прокладывал бы маршруты с учетом пробок. Многие в Турции знают «Яндекс» прежде всего как разработчика навигационного сервиса.

— А китайские компании могут выйти на международные поисковые рынки, в том числе и российский, и составить конкуренцию «Яндексу» и Google? Ведь это Baidu и Alibaba с многомиллионной аудиторией плюс очень быстро развивающиеся производители смартфонов, такие как Lenovo, Huawei, ZTE, Xiaomi и др.

— Baidu в свое время пытался выйти в Бразилию. Нам их опыт был интересен, потому что мы как раз параллельно делали первые шаги в Турции. Мы замеряли качество Baidu и довольно быстро поняли, что у китайской компании в Бразилии ничего особо не получается.

— У поисковика Bing (Microsoft) на российском рынке тоже как-то «не пошло». Как вы думаете, почему?

— У Bing очень неплохие технологии, а успеха поисковик, на мой личный взгляд, не достиг только из-за того, что доходы от поиска, которые бы они могли получать здесь, оказались слишком малыми в масштабах всей корпорации Microsoft и всех ее продуктов. Это просто вопрос приоритета ресурсов. Возможно, кстати, для Baidu основная цель не в том, чтобы заработать еще немножко денег в Бразилии или в России, а в том, чтобы удерживать свои позиции на китайском рынке.

— Могут ли социальные сети, например Facebook, и мессенджеры, которые не позволяют индексировать контент внутри себя и все больше стараются повторить функционал различных интернет-сервисов и «запереть» пользователя в своем интерфейсе (особенно на смартфонах), заменить собой поисковики?

— Тут наша позиция сформировалась давно и с тех пор не менялась. Мы за то, чтобы информация была доступна и открыта — только тогда можно на самом деле делать поиск, который предоставляет пользователю большие возможности. Полноценный интернет-поиск внутри одной платформы или системы нельзя сделать только на основе информации, которая сгенерирована и хранится внутри нее. Такой поиск — это только один из примеров того, чем интересуются пользователи интернета. Поэтому очень важно, чтобы доступ ко всему знанию человечества был открыт. Думаю, что сервисы, которые работают на всех платформах и ищут по всему объему хранящихся в сети данных, будут востребованы всегда.