Прочитайте, как обстоят дела у сайта Дневников и как вы можете помочь!
×
21:56 

"Гаусса не обманешь" или откуда брались голоса для ЕР на выборах в ЗАКС Петербурга

I.R.Army
неужели???
Перед выборами в интернете волной прокатились статьи по использованию простенькой статистики для выявления степени честности проведенных выборов. Методы интересные и для России показывали очень красивые и наглядные результаты.

Мне стало любопытно опробовать эти методы на результатах выборов 4 декабря. К слову сказать, хотя наш ЦИК с появлением интернета и стал очень прозрачным, но на то, чтобы вытащить все цифры по итогам голосования в ЗАКС Петербурга по УИК, у меня ушло более 4 часов. Т.е. УИК прозрачен, но только для очень терпеливых людей.

Хочу отметить две вещи:
1) мое знание статистики ограничивается кратким и не самым эффективным университетским курсом
2) я исследователь предвзятый. Поэтому где-то могла по предвзятости своей притянуть факты за уши.
По обоим этим пунктам принимаю любую критику.

В двух словах объясню суть двух основных методов, которые предлагают использовать исследователи. Далее предложу еще парочку своих варантов (таких же простых как дважды два).

1. Распределение явки.
Существует гипотеза о том, что явка людей на предвыборные участки должна подчиняться нормальному закону распределения и, отложенная на графике, должна представлять собой колокообразную кривую. Это мнение основано на том, что все явления в природе, пока на них не оказывается какого-то необычного влияния, подчиняются нормальному закону распределения. Этот закон подтверждают европейские выборы. Подробное описание с примерами для России и других стран приведено в следующей статье: esquire.ru/elections
Если же на части участков отмечается аномально высока явка, график начинает искривляться и приобретает пики на 100% явке. Данное поведение графика говорит о том, что на части участков произошла какая-то аномалия: либо единый патриотический порыв населения, либо накручивание вбросами и каруселями.

2. Корреляция явки и результатов для отдельных партий.
Существует гипотеза о том, что процент явки людей на избирательные участки никаким образом не должен коррелировать с результатами голосования граждан. Простыми словами, распределение голосов по партиям на участках с высокой явкой должно быть близким к участкам с низкой и средней явкой. Эти гипотезы и их российская реализация так же описаны в статье в Esqire, а еще на этом сайте: stat.golos.org/pages/3

Теперь давайте перейдем к выборам 4 декабря.

Чем больше данных использовано для анализа, тем лучше проявляются те или иные законы. Но, к сожалению, вытащить объемные данные по всем избирательным участкам с сайта ЦИК настолько сложно, что этим можно заниматься только за зарплату, а не вечером после работы и перед митингом. *) Поэтому для изучения данных по России в целом использованы только данные по регионам (всего 135 результатов). А вот по выборам в ЗАКС Петербурга уже взяты результаты каждого УИК, всего 1783.

Выборы депутатов в государственную думу РФ.



Посмотрим на график распределения явки по регионам России.

График выглядит пилообразным из-за того, что использовано мало данных. Но невооруженным глазом видно, что все регионы, в которых явка была выше 67%, не подчиняются единым законам с теми регионами, которые попали в левую часть графика и показали нормальное распределение. Хочу отметить, что сам по себе этот факт не говорит о фальсификациях в этих регионах. Он говорит лишь о том, что в них действуют другие законы! Исследователь следующим шагом разбил бы данные на две части и работал с ними по отдельности. Но я на этом пока остановлюсь. Может быть на досуге.

Следующий график самый показательный. Корреляция между явкой и голосами, отданными за разные партии.



На графике видна явная зависимость количества голосов, отдданых за ЕР, от явки избирателей по регионам. График однако бессмысленен без учета численности людей, проживающих в этих регионах, т.е. конкретного количество голосов, набранных на аномальных участках.
А вот посчитав это количество людей можно действительно ужаснуться. Треть своих избирателей (17% от всех голосов избирателей) ЕР получила в регионах, процент явки в которых более 70%. Таких регионов 30 из 135. Т.е. чисто статистически без этого хвоста ЕР в России набрала бы 31%.

Но тут я даже комментировать ничего не хочу. Меня на этих выборах интересовали в основном Петербург и Москва.

Остальной анализ посвящен выборам в ЗАКС Петербурга.

Посмотрим на распределение явки на участки Петербурга.



В целом распределение выглядит нормальным, кроме ненормально растянутого правого хвоста и пика на 99-100%. Участков, на которые пришло более 71% избирателей (конец нормального распределения) 160 штук. Всего на эти участки пришло 166000 избирателей, 8% от всех.
Помним, что график распределения не имеет смысла без учета численности людей на «аномальных» избирательных комиссиях.
В начале этой заметки было видно, что треть своих голосов по России ЕР набрала в «аномальных» регионах. Т.е. по сути, результаты выборов всей остальной страны вообще не имели особого значения. Достаточно было обеспечить правильные результаты в 30 регионах и победа в кармане.
В Петербурге же, если посчитать циферки, действуют иные законы. Давайте посмотрим на график, где показан кумулятивный итог ЕР, набранный на участках с разной явкой (по возрастанию).



На этом графике видно, что на аномальных участках (с явкой более 71%) ЕР набрала около 100000 своих ибзирателей. Т.е. 5% от общего числа голосов. Допустим, 20% избирателей на этих участках действительно голосовало за ЕР, отняв их, получаем «надбавку» в 4% от общего количества голосов избирателей.
Таким образом, на участках, где подтверждением фальсификаций является завышенная явка (воинские части, ложные результаты, вбросы, карусели и т.д.), ЕР получила всего 4% своих голосов. И, кстати, пересчет результатов на этих участках практически ничего не даст остальным партиям. Если мы по прежнему считаем, что набранные ЕР 33 % (без 4% явных фальсификаций) выглядят неправдоподобными, нужно искать другие механизмы, которые работали на основной массе участков.

Я вот решила проверить, имеют ли корреляцию результаты голосов, отданные за ЕР и за другие партии, а еще такую же корреляцию между «отстающими» партиями. В теории, эти цифры не должы никаким образом зависеть друг от друга.

На приведенных ниже графиках вы видите диаграммы корреляции между «ЕР и СР», «ЕР и КПРФ», «ЕР и Яблоко», «ЕР и ЛДПР». На графиках так же приведено значение линейного коэффициента корреляции для этих переменных.



А так же для интереса «КПРФ и Яблоко» «КПРФ и СР».



Здесь уже даже самому непредвзятому исследователю становится видна странность этих зависимостей .. Из величины коэффициента корреляции становится понятно, что основная масса дополнительных голосов у ЕР появилась за счет их исчезновения у Справедливой России, понемногу от КПРФ и Яблока. Гипотеза о том, что голоса крали у ЛДПР, статистически не подтверждается. Это не значит, что, например, КПРФ вообще не забирала голоса от Яблока, такое могло иметь место на отдельных участках, но если и было, влияния на общие итоги выборов это практически не имело.

В пользу этой же теории работает график зависимости голосов, отданных за различные партии на выборах в гос.думу по Петербургу, от явки избирателей. Правда данные взяты с детализацией только до ТИКов.



Этот график, во-первых, показывает имеющуюся зависимость результатов ЕР от явки избирателей. Во-вторых при помощи построеного полигонального тренда мы видим, что начиная от участков с явкой 53% существует четкая корреляция между голосами за ЕР и за СР (иногда обратная). Остальные партии коррелируют меньше.

Если говорить совсем простыми словами, то мой вывод из всей этой статистики таков:
1. В регионах, где забросить голоса в урну было проще простого (отсутствие подкованных наблюдателей и т.д.) это и делали.
2. В Питере было слишком много наблюдателей, чтобы нарываться. Поэтому явными фальсификациями за счет накручивания явки (например, вбросами или повальным голосованием воинских частей) занимались только 160 участков, в сумме давшие ЕР 4% голосов.
3. На остальных участках в Питере голоса добывались совсем уж беспринципно - «подменой» результатов. Т.е. цифры просто рисовались на листе бумаги. С небольшой оговоркой на реальные результаты. И это законы, которые нужно будет учесть наблюдателям на следующих, надеюсь повторных, выборах в думу. Думаю, и эти законы поддаются контролю, когда люди к ним готовы...

PS: Этой заметкой я не открыла ни для кого Америку. Все всё итак понимают, без всякой статистики. Но одно дело домыслы, а другое знания, построенные на фактах. А знания, при умелом исполоьзовании - сила.

URL
Комментарии
2011-12-11 в 01:26 

borodulin
ты хочешь поговорить об этом?
Недавно как раз пытался разобраться с этими корреляциями. Так что очень интересный пост. Спасибо. Это очень круто.

2011-12-11 в 01:28 

borodulin
ты хочешь поговорить об этом?
Недавно как раз пытался разобраться с этими корреляциями. Так что очень интересный пост. Спасибо. Это очень круто.

   

Идеотека - журнал несовершенных идей

главная