 |


 |
podmoskovnik | |
 |
 |
 |
 |
|
 |
 |
Вместо того чтобы проводить через точки приведенного в предыдущем посте графика регрессионные прямые (что ИМХО не есть правильно), дальнейший анализ подробных данных проведем так, как и раньше: просуммируем голоса избирателей по 1%-ным интервелам явки и посмотрим на результирующие графики. Подробно этот подход излагался в http://podmoskovnik.livejournal.com/5717.h tml Итак, распределения голосов в зависимости от явки:  Как и в предыдущих анализах, видно, что голоса за все партии распределены по явкам очень похоже (ЛДПР, СпРос и Яблоко - вообще близнецы-братья, за исключением мелких деталей), и только голоса одной Партии (и вы ее знаете) ведут себя по-другому. Чтобы понять, как "по-другому", попытаемся снова выделить из голосов ЕдРа "нормальную" и "аномальную" части: нормальной будем считать компоненту, пропорциональную суммарному распределению голосов за "остальные" партии, а аномальной - то, что останется. Коэффициент пропорциональности подбираем так, чтобы аномальная часть была неотрицательна. Получается следующее:  Синяя линия - распределение голосов за "остальные" партии, зеленая - собственно "нормальная" часть голосов за ЕдРо (синее распределение*подгоночный коэффициент 0.85), лиловая линия - аномальная часть голосов. В согласии со сказанным ранее при малых явках аномальная часть отсутствует и появляется в районе явки 20%. Для контроля попробуем проделать ту же процедуру с голосами за КПРФ, разделив их на нормальную и аномальную части. Получается вот что:  При таком значении подгоночного коэффициента предполагаемая аномальная часть равна 0 в широком диапазоне явок, и лишь при относительно высоких явках немного проваливается в минус. Практически аномальной части нет, что и оправдывает в некоторой степени наш подход. Если теперь предположить, что аномальная часть голосов ЕдРа - это то, что накидали в ящики, и вычесть ее, получим следующие результаты голосования: Явка: 22.02% Распределение голосов: ЛДПР: 9.82% ПатРос: 2.90% ЕдРос: 45.95% КПРФ: 21.29% СпРос: 8.54% Яблоко: 7.54% Недействительные бюллетени: 3.97% Конкретные числа зависят от выбора подгоночного коэффициента при нормальной части, но в пределах разумных отклонений ситуация принципиально не меняется: в думу проходят пять партий из шести, а не две, и совсем с другим распределением мест.
UPD Умные люди нашли ошибку в моем расчете: откорректированная явка не 19.49%, а 22.02%. Исправил. На другие результаты не влияет. Tags: анализ, выборы
|
 |
 |
 |
 |
|
 |
 |


 |
 |
 |
 |
 |
 |
 |
From: reineke |
Date: October 13th, 2009 05:11 pm (UTC) |
| (Link) |
|
второй график просто прекрасен! но подозрителен третий: получается, что результаты КПРФ, в первую очередь, Вы брали за образец нормальности-аномальности, поэтому такое совпадение. И это говорит о том, что, возможно, этот образец не очень хорош. Может быть, стоит подсчитать критерии нормальности-аномальности в зависимости от набранных голосов по каждой партии отдельно, а потом усреднять. Простите за сумбур.
|
 |
 |
 |
 |
|
|  |
 |

 |
 |
 |
 |
 |
 |
Я не претендую на теоретическую точность, а исхожу из прошлого опыта и пытаюсь поймать реальное явление. Опыт анализа прошлых выборов показывает, что начальные участки распределений голосов по явке для кандидата власти и остальных пропорциональны с высокой точностью. Интуиция подсказывает, и опыт вроде подтверждает, что голоса за кандидатуру власти добрасываются, а не вычитаются. Далее, для КПРФ я скорее готов увидеть небольшую отрицательную аномалию, локализованную на высоких явках (отобранные голоса), чем положительную на низких. Наверное, году в 2003-м и раньше части регионов могли быть проявления административного ресурса за КПРФ, но сейчас система значительно упростилась.
Хотелось бы, конечно, иметь формализованную процедуру, но пока не соображу как.
|
 |
 |
 |
 |
|
|  |
 |

 |

 |
 |
 |
 |
 |
Я уже где-то говорил, что приведенная методика распознает далеко не всякие искажения подсчета. Например, если все избирательные комиссии будут уменьшать на 30% результаты партии A и отдавать эти голоса партии B, увидеть это будет невозможно. Или если просто результаты будут рисовать руками. Остается надежда на то, что пока подтасовки делаются проще и грубее, поэтому что-то мы видим. Похоже, что до явок где-то в 50% результаты остальных партий действительно реальные. При более высоких явках (а это, видимо, самые отмороженные/задавленные комиссии) заметен существенный провал в результатах Яблока и небольшой у КПРФ. Что это - результат ручного отъема голосов или социологический эффект (например, эти отмороженные комиссии расположены в районах, где за Яблоко в принципе не голосуют; имхо - маловероятно) - требует более тонкого анализа. По ВЦИОМовскому экзит-поллу (из статьи Орешкина и Козлова в сегодняшней Новой Газете) у ЕР 45%, КПРФ 18%, Яблока 14%, СпРос 11%, ЛДПР 8%.
|
 |
 |
 |
 |
|

 |
|
|  |
 |

 |
 |
 |
 |
 |
 |
Если карусель тотальная - т.е. распространена равномерно по всем участкам (или, что то же самое, какой-либо партии просто везде завышают/занижают голоса, скажем, в полтора раза или вдвое) - с точки зрения такой статистики это невозможно отличить от честного подсчета. Пока же карусели относительно локализованные и остаются участки с честным подсчетом голосов - они по сути эквивалентны вбросам и распознаются. На самом деле выборы дают очень объемную и многогранную статистику, и подогнать их так, чтобы ничего не торчало, сложно, особенно учитывая интеллектуальный уровень наших избиркомов. Если, конечно, не использовать просто генератор случайных чисел.
|
 |
 |
 |
 |
|
|  |
 |


 |

 |
|
 |
 |
 |
 |
 |
Вы знаете, я в статистике только на уровне давно забытого вузовского курса по теории вер-тей, поэтому и выражаюсь туманно. Но как-то *кажется* (возможно, лишь кажется), что есть в вашей методе проблема: корректно ли сравнивать формы распределений, как вы делаете, допуская, что у одних параметр, условно говоря, "действительно от 0 до 80", а у других "действительно от 0 до 20"? Ведь на графике доля от общего числа. И уж не помню, справедливо ли ожидать нормальное распределение от дискретного параметра? Ведь вы не распределение по росту сравниваете в био.популяции, а выбор из нескольких вариантов?..
|
 |
 |
 |
 |
|
|  |
 |

|
 |
|
 |