April 7th, 2014

gagarin

Как получаются нелепые рейтинги Путина и аннексии?

Я не знаю, все ли понимают, как устроен ЧЕСТНЫЙ опрос общественного мнения (о жульнических опросах от ФОМ и ВЦИОМ я сейчас не буду)? Что такое "опрос N человек по репрезентативной (всероссийской и т.д.) выборке"? Нет, это не результат обработки N ответов от N человек, выбранных так, чтобы их распределение по всем параметрам совпадало с всероссийским. Я сейчас отвлекусь от проблемы репрезентативности (очень сложной) и рассмотрю только самый простой вопрос - количественный. Чтобы получить N ответов, надо опросить (выдать анкет, инициировать интервью, произвести звонков...) много, много больше, чем N. Часто в десятки, порой в сотни раз больше. Иными словами, "сырой массив" ответов на вопрос поллстера выглядит так: "отказ от ответа, отказ, отказ, вар. А, отказ, отказ, не знаю, вариант Б, отказ, отказ, отказ, отказ...". Иными словами, если бы результаты опросов публиковались без обработки, как есть - рейтинг крымской авантюры выглядел бы так: "поддерживают решение Президента 7% опрошенных, 2% осуждают, остальные не сформировали своего отношения..."

Поллстеры на основе опыта (о котором ниже) исходят из предположения, что отказ от ответа - не одна из разновидностей позиции, а независимое поведения; иными словами, что не ответившие, на самом деле, имеют позицию по теме опроса, и ее можно с некоторой точностью предсказать на основе "видимого" меньшинства анкет. "Нулевой" вариант такого предсказания - простое исключение отказавшихся от ответа и подведения итога на основе полных анкет/интервью (я отвлекаюсь от того, что само множество ответивших будет не соответствовать генеральной выборке по возрасту, полу, доходу и т.п. параметрам, и его придется нормировать, то есть разбивать на группы и завышать или занижать ценность ответов недопредставленных или перепредставленных групп - это, как я уже отметил, отдельная сложная проблема, а нам бы разобраться с легкой.

Безопасно ли применять "нулевой вариант"? Легко видеть, что он основан на предположении, что в огромном массиве отказных анкет истинное распределение позиций ТОЧНО такое же, как в маленьком массиве отвеченных. Но это очень подозрительная гипотеза; ответившие принадлежат к экзотическому меньшинству "ненормально коммуникативных" людей; а всякое меньшинство, особенно предопределенное свободным выбором, подозрительно на необычность и еще по куче параметров. Кроме подозрительности, есть и прямое возражение: совершенно очевидно, что процент "не определившихся с ответом" между вариантами А и Б среди ответивших должен быть МНОГО НИЖЕ, чем среди отказников. Если вопрос опроса сложен, далек или неинтересен - в высшей степени неестественно все же отвечать на анкету, а не уходить в отказ. Иными словами, как минимум процент ответа "не знаю" среди идеальной выборки должен быть много выше, чем в "сырых" неотказных анкетах. Кстати, на опросе ФОМ+ВЦИОМ таки да, было ненормально мало ответов "не знаю".

Следующая тема - опросы можно разделить на два типа: на предсказывающие событие и на "оценки в себе". Пример первого типа - какой молотый кофе предпочитаете, арабику, робусту или молотого не пью? Послезавтра выборы - за кого будете голосовать, за синих или зеленых, или испортите бюллетень, или не пойдете?

Второго типа: верите ли вы в Бога? Как вы относитесь к Господину Президенту (отлично, хорошо, посредственно, плохо, не знаю).

В опросах первого типа наступает "послезавтра", и подсчет голосов (если он принят в этой стране) или цифры продаж покажут, была ли верна нулевая гипотеза, а точнее, какие поправки надо было внести. Часто эти поправки хорошо рационализируются, и их можно при аналогичных опросах выставить заранее, домножая на коэффициенты: так, сторонники бюджетных брендов стесняются и чаще отказываются от ответа, чем сторонники престижных и люксовых, сторонники правящей (или вероятно побеждающей) партии чаще отвечают, а сторонники предполагаемых лузеров - чаще уклоняются от ответа.

А что делать с опросами о поддержке того или иного лидера или тех или иных мер? Никакие "выборы наутро" или "продажи в конце квартала" тут не помогут. Можно применять поправки, заимствованные от недавних выборов, по аналогии - но насколько они аналогичны по интенсивности страху показаться себе (А МОЖЕТ И НЕ СЕБЕ, кто этих поллстеров знает) предателем? Врагом народа?

Иными словами, я утверждаю, что статистические модели - даже с поправками на политическую реальность России, но России прежней, докрымской - неприменимы для определения истинных настроений людей, и даже так называемый "честный" опрос Левады говорит нам только, что большинство людей в России, как и всегда, не готовы делиться своими политическими взглядами. А готовые и при этом поддерживающие власть - составляют меньшинство.