Home
entries friends calendar user info Previous Previous Next Next
podmoskovnik - полные данные выборов 2007 - попытка анализа
podmoskovnik
[info]podmoskovnik
Add to Memories
Tell a Friend
полные данные выборов 2007 - попытка анализа
Итак, у нас есть полные данные выборов с детализацией до участковых комиссий. Объем данных колоссальный. Попробуем извлечь из них что-либо новое.

Первое. Из предыдущего анализа видно, что есть четкая корреляция, практически линейная зависимость, между явкой и голосами, отданными за Единую Россию. Для других партий такой корреляции нет. Это наводит на мысль, что есть некий скрытый фактор, который действует в пользу ЕР, но не других партий, и хорошим измерителем этого фактора является явка избирателей.

Попробуем изучить влияние нашего фактора подробнее. Поскольку самого фактора в нашем распоряжении нет, его представителем будет выступать явка избирателей. Так как главным результатом выборов являются голоса, поданные за партии, попробуем посчитать, как распределяется количество голосов за разные партии в зависимости от явки на избирательные участки. Итак, график 1:



Все участковые избирательные комиссии России были разбиты на группы по явке по интервалам длиной 1% (от 40% до 41%, от 41% до 42% и т.п.), после чего поданные за партии голоса были просуммированы по всем таким группам. Помимо отдельных партий, приведен график для суммарных результатов всех партий за исключением ЕР.

Первое, что бросается в глаза - график для ЕР разительно отличается от графиков других партий. Графики всех остальных партий фактически подобны - представляют собой одну и ту же зависимость с разными множителями. Это означает, что распределение поданных голосов по партиям (кроме ЕР) фактически не зависит от явки избирателей. Утверждение достаточно сильное, но графики его подтверждают вполне наглядно. Чтобы еще раз в этом убедиться, привожу график 2:



На графике показаны  результаты основных партий, нормированные на суммарный результат всех партий без ЕР (желтая кривая графика 1). В области левее 33% голосов очень мало, и сильные колебания графиков обусловлены просто статистическим шумом. Зато дальше кривые всех партий идут практически горизонтально - кроме ЕР, которая после небольшого плато начинает расти и к концу диапазона зашкаливает за 20. Итак, мы еще раз видим, что голосование за "нормальные" партии практически не зависит от явки, и только ЕР проявляет аномальное поведение.

Предположив, что это аномальное поведение обусловлено влиянием того самого скрытого фактора, попробуем выделить это влияние в чистом виде. Представим себе, что голоса, поданные за ЕР, состоят из двух составляющих - "нормальной" и "аномальной". При этом "нормальная" часть должна представлять собой кривую, подобную кривым голосования за все остальные партии, а "аномальная" - остаток, не описываемый такой кривой. Таким образом, формула должна выглядеть так:

                    (голоса за ЕР) = (подгоночный коэффициент) * (голоса за все партии без ЕР) + (аномальная часть)

Естественно, разбиение на компоненты зависит от величины подгоночного коэффициента. Самое очевидное решение - подобрать его так, чтобы обе составляющие (и нормальная, и аномальная) были положительны и при этом "нормальная" часть была как можно больше. Этому критерию удовлетворяет величина 1.2776 - значение кривой ЕР на графике 2 в точке минимума (при 49%). В результате получаем такое разбиение:



Полученный результат в определенной степени подтверждает наше предположение. "Аномальная" часть четко выделяется из общего результата голосования за ЕР; она практически отсутствует при явке ниже ~52% и резко появляется и устойчиво растет выше этого порога. Она имеет мало общего по форме с "нормальной" кривой голосования за все остальные партии.
(Замечу в скобках, что попытка для контроля выделить подобную "аномальную" часть в результатах КПРФ не дает значимого результата: "аномалия" находится на уровне менее 5% процентов от числа проголосовавших за эту партию).

Понимая всю спорность этого тезиса, можно взять на себя смелость приписать эту "аномальную" часть голосов нашему скрытому фактору, играющему за ЕР. Тогда, учитывая все изложенное выше, появляется возможность ответить на главный вопрос: как сказался наш скрытый фактор на результатах выборов? Суммируя отдельно "нормальную" и "аномальную" части голосов за ЕР, получаем следующие цифры проголосовавших за эту партию:

"Нормальная" часть:    30.7 млн голосов
"Аномальная" часть:     14 млн голосов
Всего:     44.7 млн голосов

Если в качестве гипотезы исключить "аномальные" голоса за ЕР из результатов выборов, получим следующее распределение голосов за ведущие партии:

КПРФ:   14.68%
ЛДПР:   10.33%
СПРос:   9.82%
ЕР:   56.09%
Явка на выборы составила бы 50.2%.

Соответственно распределение мандатов в Думе было бы таким:

КПРФ:   73
ЛДПР:   51
СПРос:   49
ЕР:   277
Сейчас эти партии имеют 57, 40, 38 и 315 мандатов соответственно - отличие не радикальное, но существенное.

Насколько обоснованны эти выводы?  Строго говоря, нинасколько. Вполне можно предположить, что избиратели ЕР принципиально отличаются по социальному поведению от избирателей других партий и обладают выраженной склонностью к коллективному голосованию за любимую партию в обстановке максимальной явки. Далее, наш подход не дает никакой возможности исключить манипуляции в любую сторону "в пределах мейнстрима" - т.е. таких, которые не меняют формы кривой голосования в зависимости от явки. Например, если бы участковые избирательные комиссии по всей стране дружно сговорились завышать на 10% число голосов за КПРФ, отнимая их у Единой России, наш подход был бы бессилен выявить это.
Кроме того, остается вопрос выбора коэффициента для "нормальной" части. Здесь, правда, ситуация проще. Изменение подгоночного коэффициента на 0.01 меняет итоговое число мандатов ЕР в Думе примерно на 1. При этом эксперимент показывает, что оптимальное значение находится где-то в пределах от 1.25 до 1.31, так что итоговые результаты существенно отличаться от приведенных не будут.

Tags: , ,
Current Mood: accomplished

Comments
oude_rus From: [info]oude_rus Date: January 15th, 2008 07:16 pm (UTC) (Link)
Кстати, в Москве хвостик практически отсутствует (я проверял). А это означает, что есть места (и я даже подозреваю какие), где "нормальной" части практически не будет, а будет сплошная аномалия.
podmoskovnik From: [info]podmoskovnik Date: January 16th, 2008 07:25 am (UTC) (Link)
И вы знаете этого человека (c) :). На самом деле в Москве тоже есть хвост, только не ближе к 100%, а в районе 66%.
beratishka From: [info]beratishka Date: January 20th, 2008 03:12 am (UTC) (Link)
>>Из предыдущего анализа видно

Какого анализа? У тебя до этого всего один пост без каких-либо анализов.

И еще вопрос: Ты откуда данные брал? В удобном виде в центризберкоме я не нашел. Неужели ты вручную суммировал все страницы типа этой?
http://www.vybory.izbirkom.ru/region/izbirkom?action=show&global=true&root=1000019&tvd=100100021960205&vrn=100100021960181&prver=0&pronetvd=null®ion=0&sub_region=0&type=242&vibid=100100021960205
beratishka From: [info]beratishka Date: January 20th, 2008 03:28 am (UTC) (Link)
Прошу пардону. Все нашел.

Я ступил немного :)
kayunov From: [info]kayunov Date: April 15th, 2008 02:36 pm (UTC) (Link)

Проверка на адекватность/устойчивость

1.
Сказано, что подгоночный коэффициент подбирался так, чтобы "..."нормальная" часть была как можно больше". Во-первых неясно - в каком смысле "больше" (по сумме/интегралу, по максимуму, etc), во-вторых, раз уж речь идет об аномалии, то следовало бы подбирать так, чтобы аномальная часть была как можно меньше (если смысл критерия "больше-меньше" не делает этот выбор дуально взаимосвязанным (для измерения по максимуму, например, это не обязательно так)).
Если дуальности нет, то имело бы смысл проверить и по этому критерию и сравнить результаты - для оценки устойчивости метода/подхода.

2.
Поскольку КПРФ из прочих (не ЕР-ов) выраженно самая крупная, то при проверке на КПРФ следовалобы взять за основу не "голоса за все партии, кроме ЕР и КПРФ", а "голоса за все партии, кроме ЕР [поеликуподозревается в аномальности] иКПРФ [поелику составляет почти половину оставшегося от ЕР]" и, если нет технических проблем, просчитать тоже и для ЛДПР и СР. Опять-таки для проверки устойчивости подхода.
podmoskovnik From: [info]podmoskovnik Date: April 16th, 2008 08:53 am (UTC) (Link)

Re: Проверка на адекватность/устойчивость

1. Как можно больше при условии неотрицательности обеих частей (аномальной и нормальной) в области существенной статистики (явки выше ~40%). Это, пожалуй, единственный формализуемый критерий, который мне удалось измыслить - но он же и самый жесткий в отношении нормальной части. Можно также минимизировать "по Чебышеву" - разрешить аномальной части быть отрицательной в области главного пика, и минимизировать максимальный ее модуль в этой области. Разница между этими вариантами корректировки - 1-2 голоса в Думе у ЕР (точно не помню, но не больше). Других разумных критериев разбиения мне придумать не удалось.
Проверять дуальность при обоих подходах особого смысла не вижу, оба строго ориентированы на аномальную часть, а первый еще и дуален сам по себе.

2. Из графика 2 (хотя, может, картинка мелковата) видно, что доли и КПРФ, и СР, и ЛДПР постоянны в широком диапазоне явок. КПРФ хотя и больше всех, но не доминирует в "остальных партиях" (~40%), поэтому особого смысла выкидывать ее из знаменателя не вижу. Для ЛДПР аномальный вклад тоже малозаметный, проверял.
6 comments or Leave a comment
profile
podmoskovnik
Name: podmoskovnik
calendar
Back May 2008
123
45678910
11121314151617
18192021222324
25262728293031
page summary
tags

Advertisement