Выборы: прогноз будет ошибочным

Владимир Каганский

Провалы прогнозов результатов выборов на базе опросов общественного мнения стали обычными с 1993 года. Всякий раз происходит нечто непредсказанное, для чего задним числом ищутся объяснения. Ситуация парадоксальна: обоснованные прогнозы не сбываются, а сбывающиеся — необоснованны.

Выдвигаются разные объяснения такой ситуации. Многие адресованы к факторам, которые заведомо лежат вне сферы анализа: сложность переходного общества, неадекватность электората, манипуляция избирателями, фальсификации результатов выборов. Среди обсуждаемых причин ошибок почти нет такой, как методика опросов.

Нет лучшего способа проверить качество опросов общественного мнения, нежели выборы: ошибки заметны сразу. Цена таких ошибок для профессионалов и общественности (должна быть) чрезвычайно велика. Поэтому следовало бы ожидать, что ошибки будут анализироваться очень тщательно, с выдвижением, обсуждением и проверкой всех возможных объяснений причин таких ошибок. Но так ли это? Все ли гипотезы, объясняющие хронические дефекты опросных прогнозов, выдвинуты? Все ли причины рассмотрены? Ведь если у таких ошибок есть определенная причина, то это означает дефектность и недостоверность всех построений, основанных на опросах общественного мнения, в том числе и коммерческих, связанных с рекламой и т. п.

Среди причин ошибки прогнозов пока не фигурирует одна существенная причина расхождений. Эту гипотезу можно явно и аккуратно сформулировать, при желании — проверить. Она не является капитуляцией, вроде приписывания электорату голосования наперекор собственному, высказанному в опросе мнению. Она исходит из предпосылки, что именно прогноз выборов — самый эффективный способ проверить качество сети опросов. Наконец, эта гипотеза ориентирована на объяснение лишь некоторой части ошибки и заведомо не исключает иных причин.

Гипотеза выдвигается в рамках профессиональной научной и экспертной компетенции автора и состоит в том, что опросы общественного мнения пространственно нерепрезентативны.

Налицо серьезное различие данных опросов и результатов выборов. А ведь выборы можно считать своего рода предъявлением генеральной совокупности. Тогда имеет место заметное и существенное различие выборки и генеральной совокупности. Совокупность и выборка не совпадают структурно, как должны, а различны. Если это так, то выборка неполно (неверно) отображает генеральную совокупность и потому нерепрезентативна.

Есть основания полагать, что структура выборки опросов общественного мнения не репрезентативна именно в пространственном отношении.

Сколько известно, сети выборки разных социологических служб методически близки или даже еще и сходны (нам знакомы сети ВЦИОМа и ФОМа). Тогда надо предположить: именно структура выборки порождает систематическую ошибку, как ее породило бы систематическое игнорирование, скажем, одной трети возрастов респондентов.

Характер расхождения социологических данных и результатов для нескольких выборов имеет общие черты. Эффект «неожиданного» всплеска голосования за «новую силу» (рушащий прогнозы) распределен территориально неравномерно и неслучайно: он сконцентрирован в определенных местах. Несколько раз сюрпризом оказывалось голосование на Дальнем Востоке, территории несложной и достаточно известной. Различие же данных прогнозов и выборов столь велико, что стоит говорить о явной неполноте охвата, даже об искажении картины. По нашей экспертной оценке, игнорируется порядка трети населения. Игнорируется опросами — но голосует. Подчеркнем: неохваченное население локализовано и приурочено к территориям конкретных типов.

Сомнительна сама территориальная структура выборок опросов. Страна неоднородна и ее дифференциация сложна. Прежние и новые социально-экономические и культурные различия велики. При этом пространственная дифференциация страны имеет четкие и ясные закономерности. И эти закономерности довольно хорошо изучены. При конструировании же сети опросов пространственная дифференциация населения в основном сводится к 11 социально-экономическим районам РФ (или 7 федеральным округам), различиям между регионами — субъектами федерации, различиям сельской местности и городов и городов по людности (численности населения), разнице между регионами и национальными регионами («автономиями»), отчасти еще и дифференциации территории регионов по простейшему варианту схемы «центр — периферия». (Эти же аспекты используются и при интерпретации данных опросов.)

Это вполне резонные основания, но они недостаточны. Территориальная дифференциация не может быть сколь-нибудь полно представлена таким образом. Есть реально существующие типы территорий и поселений, которые игнорируются, как и вообще реальная дифференциация территорий, не сводимая к официальным учетным типам.

За счет избирателей «исчезающих» типов территорий и возникает общая систематическая ошибка.

Приведем примеры. Не учитываются очень специфичные (но не уникальные) закрытые города (ЗАТО) и подобные им территории, где живут миллионы. Эти территории малодоступны общественности, но они имеют точные открытые доступные аналоги. Иной пример — дальняя периферия страны вроде Камчатки. Общественное умонастроение не раз радикализировалось именно на этих типах территорий. Так, Арзамас-16 (Саров) и Камчатка голосовали в 1993 году за ЛДПР и коммунистов, что якобы трудно было предвидеть, хотя трудно было этого просто не видеть, в чем автор убедился, ведя полевые исследования в этих регионах.

Еще весомее игнорирование таких типов территорий, как внутренняя периферия и т. н. «вторые города» (Братск, Сургут, Череповец, Тольятти и т. п.). Эти типы территорий по численности населения нигде не преобладают, но зато представлены в очень многих регионах. Это уже десятки миллионов жителей, и они не представлены в выборке или представлены непропорционально мало.

Обычно утверждения о наличии явных дефектов в сети опросов сотрудниками социологических служб не оспариваются, но приводятся два аргумента, объясняющие их причины и указывающие на невозможность исправления. Во-первых, существуют ограничения на объем выборки, что приводит к ее недостаточной детальности. Это, казалось бы, резонное утверждение совершенно неверно. Сети выборки содержат столь много «дублей» (напр. Воронеж и Липецк — для Центрально-Черноземного района, Самара и Саратов — для Поволжья в сети ВЦИОМа), что размер сети можно было бы даже сократить, увеличив при этом ее репрезентативность. Во-вторых, утверждается, что в силу тех же (и ресурсных — затраты на опросы) ограничений есть заведомо труднодоступные для опросов территории. Однако труднодоступные места, как и любые территории, могут быть репрезентированы иными (более доступными) правильно определенными территориями. Смысл разработки сети выборки и состоит в том, чтобы одни места замещали многие другие, а в правильности замещения и состоит главный критерий качества сети.

Проблема не в детальности и стоимости сети, проблема в точности. Узловой район крупного города содержит территориальные группы, которые репрезентируют подавляющее большинство населения страны. Дело только за тем, чтобы их выделить и правильно установить аналогии (корректно сформулировать для территорий отношение репрезентации). Аналоги всех существенных территорий страны есть не так далеко даже от Москвы.

Указания на ограничения сети по величине и ресурсные ограничения — просто отговорки, а дело состоит в непонимании и незнании пространства России.

Моя гипотеза и состоит в том, что пространство страны неадекватно представлено при опросах общественного мнения не зависимо от размера выборки.

Чрезвычайно важно обсудить и проверить эту проблему — провести экспертизу пространственной структуры сети выборки. Если говорить без экивоков, то придется предположить, что «сообщество опросов» проявляет признаки профессиональной безответственности, следствием чего и оказывается пространственная невменяемость.

Сейчас, накануне очередных выборов, я дам прогноз:
1) опросы общественного мнения не дадут приемлемого прогноза итогов выборов, между прогнозом и результатами будет явное расхождение (ошибка);
2) это расхождение будет резко неравномерно распределено по территории страны;
3) размещение этого расхождения будет вполне закономерно: зоны максимального расхождения будут конкретными и уже известными типами территорий, не представленными или неполно представленными в сети опросов.

Автор — ведущий сотрудник Института национальной системы экономики