Кого слушает президент

Предсказываем по интернету

Физики научились предсказывать кассовый успех фильмов по данным соцсетей

Иван Куликов 21.06.2012, 14:52
Поведение больших групп людей можно предсказывать по данным соцсетей AFP
Поведение больших групп людей можно предсказывать по данным соцсетей

Японские физики научились предсказывать кассовые сборы фильмов по данным соцсетей. Похоже, зарубежная социология становится все более точной предсказательной дисциплиной. Станет ли таковой российская, чьи методы безнадежно устарели? «Газета.Ru» подводит предварительные итоги нового «сетевого» переворота в мировой социологии.

Число людей, пользующихся социальными интернет-сервисами, стремительно растет, а поведение информации в электронных соцсетях почти не отличается от ее поведения в офлайновых человеческих сообществах. Уже сейчас можно с уверенностью заявить, что

будущая социология (и особенно социология прогностическая, то есть моделирующая возможные сценарии, по которым может развиваться общество) — это наука, изучающая эволюцию социума на основе данных, почерпнутых из электронных сетевых платформ.

Старые индустриальные методики, основанные на выборочном анкетировании, тотальных переписях населения, фокус-группах и разных статистических трюках, придуманных, чтобы компенсировать недостаток данных, их дефектность, а также невозможность отследить развитие ситуации в реальном времени, хотя и остаются популярными у социологов (особенно, к сожалению, у отечественных), стремительно уходят в прошлое: объем доступной и ценнейшей информации, циркулирующей в соцсетях в режиме realtime огромен и легкодоступен, даже независимо от провозглашаемой их владельцами политики защиты конфиденциальных данных.

Нужны лишь соответствующие инструменты, чтобы правильно эти данные извлекать, анализировать и получать предсказательную пользу.

И такие инструменты разрабатываются.

Из них самые востребованные сейчас — это математические модели, основанные на теории графов (граф — узловой элемент сети, соединенный с другими узловыми элементами), клеточных автоматов, фазовых переходов и на когнитивных исследованиях.

Так, взяв на вооружение один из постулатов теории информации, что «отсутствие данных — тоже данные», группа немецких математиков показала недавно, как, используя открытые сведения, почерпнутые из интернета, можно составлять портреты людей-невидимок, вообще не пользующихся соцсетевыми сервисами, то есть собирать так называемые зеркальные, или теневые, профили. Помимо миролюбивых маркетологов, такие профили могут использовать, например, спецслужбы для мониторинга политической оппозиции или для вычисления глубокого террористического подполья, перекрывшего каналы связи с интернетом (см. «Из тени в сеть перелетая»).

Другой показательный пример — теория клеточных автоматов, с помощью которой итальянские социологи смоделировали динамику общественных умонастроений в обстановке сильного корректирующего действия телепропаганды («казус Берлускони — Путина»), о чем «Газета.Ru» подробно рассказывала год назад .

Тогда, в марте 2011 года, в это было сложно поверить, но сейчас, когда общественно-политическая ситуация в России радикально изменилась буквально за полгода, правильность полученных социологами выводов стала очевидной.

А именно, распределенный (в терминологии модели — асинхронный) сетевой доступ к альтернативной информации оставляет телепропаганде (синхронным сигналам) все меньше шансов на успех; одновременно общественные умонастроения начинают флуктуировать все интенсивнее; роль экспертного мнения (не только «говорящих голов» в СМИ, но и влияющих на принятие решений) снижается, а наличие большой массы политически индифферентного населения лишь способствует, как это ни парадоксально, дальнейшему «раскачиванию лодки» (рискнем предположить, раз прогноз уже частично сбылся, что именно последний фактор будет иметь летальное значение для кремлевского «зомбоящика», навязывающего обществу «благорастворение воздухов»).

Наконец, к не менее интересным выводам пришла другая группа, изучающая общественные умонастроения с помощью теории фазовых переходов.

Оказалось, что критическая доля имеющих сходные взгляды членов общества, необходимая для быстрого фазового перехода всей соцсети (другими словами — кардинальной смены общественного климата) теоретически должна составлять не менее 10 процентов (см. «Мир меняют упрямые меньшинства»). Конечно, эта цифра, полученная методом математического моделирования соцсетей, весьма условна, но она заставляет еще раз задуматься над капризной сущностью таких неустойчивых динамических объектов, как «общественные умонастроения», пребывающие, несмотря на видимую «стабильность», в коварном равновесии.

Постулат «группа маргиналов меняет мир», казавшийся ранее романтичным и прекраснодушным, не входит, таким образом, в противоречие с математикой.

Кстати, современные российские реалии эту цифру тоже скорее подтверждают: мы видим, как относительно небольшое число упрямых бузотеров, непримиримых диссидентов и настойчивых спорщиков, активно использующих свои социальные контакты, действительно способно изменить общество.

Как бы то ни было, оценить, какие из вышеприведенных наблюдений являются компьютерно-математическими артефактами, а какие соответствуют реальной жизни, можно лишь интуитивно и навскидку: прогностическая компьютерная социология делает первые шаги, модели, которые она использует, уже достаточны сложны, но все равно чересчур «причесаны» и далеки от точности, не говоря уже о методах их наблюдательной проверки, за которые вообще еще никто не брался.

Но некоторые аналитические наработки, имеющие непосредственное отношение к жизни, в арсенале новой сетевой социологии имеются.

Так, группа социопсихологов из Научно-технологического университета Миссури (США), чью статью приняли для публикации в IEEE Technology and Society Magazine, проанализировала содержание анонимных серверных логов, отображавших сетевую активность студентов университета за год, и сопоставила выявленные отклонения (например, слишком частое использование электронной почты, файлообменных сетей и чатов, сетевых игр, а также частые переключения между различными интернет-приложениями, получившие даже специальное обозначение «поточно-временной энтропии данных») с психологическими профилями 261 студента, заранее составленными на основе специального опросника, определяющего уровень угрозы тревожных расстройств, депрессивных и преддепрессивных состояний и пр.

После раскрытия сетевых адресов выяснилось, что специфическое сетевое поведение определенных студентов четко коррелировало с их депрессивной и преддепрессивной психосимптоматикой, выявленной в тестах.

Обнаруженная закономерность, таким образом, позволяет составлять психопрофили интернет-пользователей даже без анализа содержательной (текстовой, визуальной, звуковой) части их сетевой активности, зная только, с какой частотой какими сетевыми сервисами они пользуются. Такая информация уже позволяет прогнозировать поведение рядового пользователя интернета, а собирать ее можно как косвенно (с помощью разрешенных программных средств, отслеживающих использование ресурсов), так и прямо: известно, например, что закон обязывает некоторых европейских интернет-провайдеров несколько лет хранить логи всех клиентских соединений.

Математические модели соцсетей, дополненные новой группой переменных — психопрофилями ее участников — станут отображать и прогнозировать поведение реальных человеческих сообществ более точно.

Рано или поздно такие более развернутые и менее «причесанные» модели будут созданы и опробованы в деле, и тогда динамику тех же общественных умонастроений — в диапазоне от готовности к протестным действиям и реакции на конкретные события до готовности покупать тот или иной товар — можно будет точно прогнозировать, зная психопрофили сетевых агентов, которые могут быть и консерваторами, и людьми, открытыми новому опыту, экстравертами или интровертами, эгоцентриками или кооператорами и т. д.

То, что сетевая социология развивается по пути прогностического моделирования реальных человеческих сообществ на основе интернет-данных, подтверждает еще одно исследование, опубликованное в Computers in Human Behavior.

Его авторы, социопсихологи Келли Мур и Джеймс МакЭлрой из Университета штата Айова, подробно изучив, как пользуются Facebook´ом 143 студента, показали, что активность пользователей этого ресурса (их реакцию на чужие посты и прочие сценарии поведения)

можно предсказывать на основе хорошо известной и статистически обкатанной пятифакторной модели личности — так называемой большой пятерки.

Последняя включает в себя пять общих независимых (то есть слабо коррелированных, когда, например, сильному экстравертному характеру не обязательно соответствует слабая усидчивость, и наоборот) ключевых характеристик личности, или факторов: экстраверсию, доброжелательность, добросовестность, открытость и нейротизм. Которые, в свою очередь, подразделяются на, как правило, шесть подфакторов (озабоченность, враждебность, уязвимость перед стрессом, импульсивность и т. д. — в случае, например, нейротизма).

Разным комбинациям этих факторов/подфакторов, определяющим нашу индивидуальность, соответствуют разные сценарии поведения, и пятифакторная модель давно и успешно используется психологами для прогнозирования этих сценариев в тех или иных ситуациях (например, ситуации конфликта, сотрудничества, стресса и т. д.). В «доинтернетовскую» эпоху такое прогнозирование ограничивалась поведением одного человека или небольшой группы людей, так как для анализа больших групп, не говоря уже о целом обществе, информация, описывающая комбинацию психофакторов каждого члена суперсети, у социологов отсутствовала.

Сейчас, с появлением и взрывным ростом различных сетевых сервисов (притом не обязательно соцсетей в узком смысле слова, например «Фейсбука»), такая информация появилась.

Определив многофакторные профили огромного числа интернет-пользователей методом косвенного анализа их сетевой активности, как, например, предлагает делать группа из Миссурийского университета, и встроив эти данные в математические модели, описывающие поведение сетей, можно прогнозировать поведение больших групп людей — вплоть до масштабов общества. Старой досетевой социологии такая задача была не по плечу из-за плохой доступности вычислительных ресурсов, низкого качества моделей и, главное, нехватки данных, которые лежат сейчас просто на поверхности.

Впрочем, как недавно показала группа физиков из Университета Тоттори, научившихся предсказывать по данным соцсетей кассовые сборы фильмов, идущих в японском прокате, для успешного прогнозирования общественной активности строить столь сложные и многофакторные модели, сильно усложняющие вычисления, совсем не обязательно. Достаточно, например, обнаружить корреляцию в динамике обмена постами в соцсетях, выбранными по определенному параметру (первая кривая), бюджетами, потраченными на рекламу фильмов (вторая кривая), и кассовыми сборами картин (третья кривая). Имея на руках только первую и вторую кривую, предшествующие точке премьеры на временной оси, можно, используя несложную модель, предсказать и поведение третьей, притом, как показали сделанные прогнозы, очень точно (статья с описанием модели выложена в свободном доступе на сайте New Journal of Physics).

Понятно, что при соответствующей коррекции модели такой прогнозируемой переменной может быть все что угодно.

Например, рекламируемые товары и услуги, в том числе политические товары (программы партий и кандидатов на выборные должности) и политические услуги (ход реформ). В свою очередь, те, кто будет использовать данные соцсетей для прогностического моделирования и снижения возможных рисков и издержек, получат потенциальное преимущество над конкурентами, а сетевая социология из наблюдательной дисциплины превратится в инструмент по изменению реальности.

Воспользуется ли шансом изменить изживший себя досетевой инструментарий отечественная социология, к которой обращаются сейчас в последнюю очередь, пытаясь понять, что ждет российское общество в будущем?

Сможет ли она конкурировать с разработками итальянских, американских и японских социологов, которые объясняют процессы, идущие в нашем обществе, намного лучше, чем скатившиеся к жанру гороскопа пресловутые «данные соцопросов» российских институтов, ставшие уже предметом политической торговли и вызывающие недоумение даже у неспециалистов? Ведь соперниками, желающими заглянуть в будущее, могут быть не только финансовые корпорации, медиа, политические партии или кандидаты в президенты, но и целые государства, которые, как показывает история, умеют поглощать конкурентов, которые это будущее не распознали.