Газета.Ru в Telegram
Новые комментарии +

Гибрид землетрясения и базарной площади

Анализ информационных трендов в блогосфере

Результаты математического анализа информационных трендов в блогосфере показали, что популярные блогерские тренды большей частью перепощены из традиционных СМИ, которым блогеры прочили скорую кончину. А динамика поведения блогосферы описывается теми же методами, которые с позапрошлого века применяются в сейсмологии: сравнение блогерских скандалов с землетрясениями и извержениями вулканов теперь не только литературная метафора, но и научный факт.

Свобода слова и обмена мнениями, реализованная в интернете на различных сетевых платформах, объединяющих огромное число людей, привела к возникновению особой информационной среды, которую часто характеризуют как принципиально новый тип медиа, оказывающий значимое влияние на нашу жизнь. Конкретный смысл этой новизны остается предметом горячих споров, но симптоматично, что из нее уже пробуют извлекать профит не только маркетологи, политики и спецслужбы, но и различные порталы-агрегаторы, имитирующие традиционные СМИ с их новостными лентами, обзорами и аналитическими статьями, поставщиком контента для которых является не «цеховая» журналистика, а блогерское сообщество. В этом есть резон: как и в случае традиционных СМИ, какая-то информация, циркулирующая в блогосфере, провоцирует больший интерес, другая — меньший, третья остается незамеченной.<1>

По какой причине та или иная тема вызывает ажиотажный спрос — проблема риторическая: слишком много здесь сложных или вообще невычислимых факторов.

А вот ответить на вопрос, как именно всплеск спроса происходит, можно. Группа исследователей из Лаборатории компьютерной социологии в Пало Альтои факультета прикладной физики Стэнфордского университета сделала это на примере Twitter — итоговая статья «Возникновение и распад трендов в социальных медиа» опубликована на сайте препринтов ArXiv.org.

Для анализа были выбраны топ-заголовки (trending topics), оформленные на главной странице Twitter в виде бегущей строки по аналогии с бегущей лентой новостей на сайтах информагентств и традиционных СМИ. Эти заголовки, состоящие из одного-трех слов, представляют собой самые обсуждаемые темы в Twitter на конкретный момент времени — собственно, «блогерские тренды». Заголовки высчитываются специальным алгоритмом по частоте употребления слов в общем потоке микроблогов. Этот алгоритм является проприетарной (то есть закрытой для общего пользования) частью Twitter, что задает несколько непрозрачные условия для анализа выдаваемых им данных, однако о его нейтральности и адекватности косвенно свидетельствует факт, что определенная группа заголовков (34%) появлялась и исчезала в топ-ленте с интервалами, соответствующими разнице в часовых поясах.

В общей сложности было обработано 3361 топ-заголовков и 16,32 млн связанных с ними постов, полученных в Twitter за 40 дней в сентябре-октябре 2010 года. Число твитов (постов), определяемое для каждого топ-заголовка через систему поиска Twitter по ключевым словам (совпадающим, естественно, с заголовком) измерялось с шагом в 20 минут с момента, когда заголовок появлялся в ленте и вплоть до его исчезновения из топ-списка.

Это позволило достаточно точно проследить динамику тренда от его рождения до кончины.

В ходе поиска факторов, влияющих на продолжительность жизни блогерского инфотренда, было установлено, что живучесть тренда обусловлена не числом постов как таковых, а числом юзеров, хотя бы раз отметившихся в топ-теме: корреляция между числом уникальных авторов и временем жизни тренда оказалась очень высокой — 0,8.

Другими словами, шансов, что интересная тема обсуждения вместе с набежавшей на нее аудиторией не сменится на другую, если вы решите высказаться больше одного раза по существу вопроса, в блогосфере очень немного — не тратьте, проще говоря, энергию, лучше промолчите.

Правило это больше подходит под формат скоротечного обмена мнениями на базаре, чем серьезного консилиума в кабинете, и апологетам «медиа 2.0» придется его, к сожалению, учитывать, хоть речь, конечно же, идет пока о Twitter, ограничивающем реплики 140 знаками — для содержательного разговора маловато.

Но на этом математики с социологами не остановились и решили изучить секрет выживания трендов в пространстве новых медиа с другой стороны — рассмотрев внимательнее фигуру тренд-сеттера. Здесь обнаружились не менее интересные подробности.

Существует две разновидности тренд-сеттеров. Первая — те, кто собственно инициирует тренд. Вторая — те, кто пропагандирует ту или иную тему, когда она уже стала популярной, то есть активная массовка.

У инициаторов набор инструментов для запуска тренда невелик: эти люди должны быть либо очень активными блогерами, то есть публиковать много постов в единицу времени, либо быть очень популярными и иметь большое число подписчиков (фолловеров), либо то и другое одновременно. Действительно, в группе влиятельных блогеров, участвовавших в запуске минимум пяти топ-тем в течение 40 дней (то есть начавших выставлять посты на определенную тему еще до того, как она вошла в топ-лист), уровень активности оказался очень высоким — 26,8 постов в день (в среднем). Но когда подсчитали корреляцию между уровнем активности (у одних активных блогеров она оказалась выше, у других ниже) и числом успешных трендов, в которые инвестировала свои усилия активная массовка, он оказался низким — всего 0,22. Есть еще подписчики, но здесь, к удивлению всех, корреляция скатилась вообще на грань погрешности — до 0,01.

Таким образом, живучесть трендов в Twitter мало обусловлена активностью отдельных блогеров и совсем не обусловлена их популярностью.

Чем же она обусловлена тогда? Ответ на этот вопрос дали пропагандисты. 31% постов на трендовые темы представляют собой рутинные перепосты понравившейся темы — ретвиты. Более того, корреляция между числом ретвитов и временем жизни топового тренда очень высокая — 0,96: такой тренд живет постольку, поскольку люди отфутболивают его друг другу, не добавляя никакой информации к оригинальному посту. Был составлен список 22 блогеров, на каждого из которых пользователи активно ссылались в случае как минимум 50 топовых заголовков Twitter. Большую часть этого списка составили традиционные СМИ — New York Times (59 заголовков), CNN (84), Reuters (57), Huffingtonpost (63) и т. д.

Таким образом, большая часть информационных трендов, порождаемых блогерским сообществом Twitter, оказалась ретрансляцией данных, почерпнутых из традиционных СМИ.

Можно ли распространить этот вывод и на всю остальную блогосферу? Теоретики новых медиа с этим не согласятся и будут, конечно, правы: Twitter — это микроблоги, а есть еще настоящие, большие блоги, где свобода слова не ограничивается телеграфными 140 знаками. Наверное, в них-то и обитают неуловимые «медиа 2.0».

Что в действительности в них обитает, выяснили, согласно статье, которую также можно посмотреть на сайте препринтов, сотрудники Международного института прикладного системного анализа (IIASA, Австрия), секции комплексных систем Университета Вены и Института Санта-Фе (США). Анализу подверглись 168 популярных американских блогерских ресурсов, специализирующихся на обсуждении внутренней политики правительства США. Среди авторов этих блогов значатся помимо прочих известные американские журналисты (Гленн Бек, Тэйло Марш и др.). Исследование было сфокусировано на временном отрезке в 670 дней — с июля 2008 по май 2010 года. Запись всей информации, содержащейся в блогах, была произведена с разрешением в 1 секунду. Из всего массива данных по определенному алгоритму были выявлены ключевые слова и построены графики их частотного употребления. По форме они напоминают записи сейсмографов. И действительно, распределение интенсивности информационных пиков в блогосфере оказалось сходным с распределением интенсивности подземных толчков в земной коре — афтершоков (малых толчков, следующих за главным ударом; число афтершоков убывает обратно пропорционально времени, прошедшему с момента толчка, и этот закон носит имя японского ученого Омори, который в конце XIX века наблюдал афтершоки сильного землетрясения в центральной Японии) и форшоков (малых толчков, предшествующих главному удару).

А вот соотношение слабых и сильных медиасобытий подчиняется другому эмпирическому закону – Гуттенберга — Рихтера, согласно которому сильные землетрясения случаются гораздо реже, чем слабые: если в определенном районе каждый год происходит одно землетрясение с энергией 100 условных единиц, то там же ежегодно будут происходить приблизительно 1000 землетрясений с энергией 1 у. е.

Наконец, было выделено два типа информационных встрясок, «сейсмограммы» которых отличаются. Похожий на колокол график для эндогенной (внутренней) встряски представляет собой пик, которому предшествует кривая, фиксирующая постепенное увеличение частоты толчков с последующим почти симметричным по форме затуханием. Толчки, которые она фиксирует, индуцированы информацией, долгое время циркулирующей внутри самой блогосферы как до пика, так и после.<3> Авторы статьи указывают также, что пиковая и послепиковая реакция блогосферы коррелирует с поведением ключевых слов-маркеров, предшествующим эндогенной встряске, то есть в известном смысле предсказуема. Зная поведение прекурсоров, можно даже управлять этой реакцией.

Эндогенных событий было выявлено примерно 150, экзогенных (то есть вызванных извне) — 1000.

Как можно интерпретировать такую большую разницу? Согласно проведенному анализу, блогосфера — легковозбудимая среда, теряющая равновесие по двум основным сценариям. Согласно первому, колоколовидному, в части этой среды начинается постепенное упорядочивание информации (блогеры проявляют возрастающий интерес к определенной теме), достигающее в какой-то момент наименьшей энтропии (максимума обсуждения) с последующей постепенной релаксацией и потерей информации (интерес к теме пропадает). Это колебательный процесс, и важно, что информация, в нем участвующая, содержится в самой осциллирующей системе, то есть эндогенна.

Второй сценарий совсем другой: несмотря на отсутствие информации в системе, она мгновенно упорядочивается (большое число блогеров начинает неожиданно обсуждать какую-то тему). Понятно, что источником низкой энтропии выступает здесь информация извне. Защитник «медиа 2.0» обязан возразить, что в этом случае источником внешней информации не обязательно должны быть традиционные СМИ, которые сами возбуждаются по той же схеме, реагируя на какие-то события (то же выдвижение в кандидаты Сары Пэйлин).

Но это не так. Социальные медиа — Twitter и «большие» блоги — строятся на одном и том же принципе, в отличие от традиционных СМИ с их иерархической редакционной политикой.

Это одноранговые, неиерархические сети с равноправными узлами-агентами (одиночными блогерами) по типу P2P, процессы упорядочивания/возбуждения в них односущностны, поэтому с большой степенью вероятности можно утверждать, что экзогенные события (самые, как выяснилось, частые для блогосферы) индуцируются традиционными СМИ точно так же, как долгоживущие тренды в Twitter. В противном случае придется разделить блогосферу на «истинные новые медиа» и «неистинные», а это уже противоречит неиерархической идеологии «медиа 2.0».

С другой стороны, те, кто был уверен, что блогосфера кроме воздуха умеет сотрясать и землю, тоже оказались в некотором смысле правы и уже могут приступать к разработке собственной шкалы Рихтера, измеряющей блогерскую активность.

Что думаешь?
Загрузка