Сотрудник Калифорнийского университета в Лос-Анджелесе (UCLA) Роуджа Бандари представила алгоритм, позволяющий предсказать с точностью до 84%, будет ли та или иная новость популярной в Twitter или в других социальных сетях. Бандари, защищающая диссертацию по электротехнике, разработала этот алгоритм совместно с двумя инженерами — Ситарамом Асуром и Бернардо Хуберманом из лабораторий Hewlett Packard, где она работала в качестве интерна. Доклад с описанием алгоритма был представлен на Международной конференции по внедрению методов искусственного интеллекта в социальных сетях и медиа и опубликован на сайте Hewlett Packard Labs.
Таким образом,
этот алгоритм можно использовать для достаточно точного прогноза популярности той или иной новости в сети «Твиттер» еще до того, как она будет опубликована.
Изучая проблему прогнозирования информационных трендов в соцсетях, Ситарам Асур и Бернардо Хуберман из HP Labs ранее показали, что можно с достаточно высокой точностью предсказывать динамику распространения данных в сети «Твиттер». Два года назад Бандари, работающая под руководством профессора UCLA Ввани Ройчхоудхури, также получила обнадеживающие результаты, прогнозируя распространение информации в «Твиттере» во время общественных протестов 2009 года в Иране, вызванных фальсификациями на выборах.
Объединив усилия, они сделали следующий шаг и разработали предсказательный алгоритм, высокая точность которого удивила самих исследователей.
skin: article/incut(default)
data:
{
"_essence": "test",
"incutNum": 3,
"pic2": "/files3/537/4710537/1-isyournewsar.jpg",
"picsrc": "Хотите стать более популярным в Твиттере? Этот алгоритм вам поможет. // R. Bandari et al. ",
"repl": "<3>:{{incut3()}}",
"uid": "_uid_4710537_i_3"
}
Еще одним параметром, исследованным авторами доклада, стал так называемый «субъективный классификатор новости».
В качестве моделей, описывающих разный стиль подачи информации, были использованы расшифровки высокорейтинговых разговорных радиошоу американского консерватора Раша Лимбо, известного своим субъективным стилем, и популярного либерального комментатора Кейта Олберманна, признанного образца «непредвзятой журналистики».
Тема новости также не является надежным классификатором ее популярности в соцсети.
Самую большую положительную корреляцию демонстрируют здесь узкоспециализированные новости на тему новых технологий, которые пользуются наибольшей популярностью в «Твиттере». Но если новостная статья затрагивает более одной темы, предсказать ее популярность становится все сложней. Отчасти это может быть связано и с дефектом предсказательного алгоритма, но та же прогностическая неопределенность, к удивлению авторов доклада, постигла и «мононовости» — о знаменитостях и крупных компаниях. Возможно, здесь работают некие внешние факторы, связанные с динамикой общественного мнения, которые алгоритм, ограниченный данными, циркулирующими только в сети «Твиттер», просто «не видит».
Последнее накладывает известные ограничения на предсказательную методику, предложенную авторами, о чем они тоже пишут.
«Если вы работаете на крупное СМИ, долго доминировавшее на рынке информации, то сейчас правила изменились: рассчитывать на старую аудиторию уже нельзя — вы обязаны конкурировать с новостными ресурсами следующего поколения, работающими по другим принципам. Так, уже не имеет большого значения, насколько эмоционально, субъективно или ярко вы аргументируете свою позицию: людей прежде всего интересует конкретная информация, а не то, как вы ее преподносите. Навязчивый стиль уже не гарантирует вам большее внимание», — резюмирует Бандари.