« Върни се назад Публикувано на 19.07.2010 / 19:22

За послушните депутати и заспалата опозиция

Спомняте ли си, че миналата седмица споменах за разпечатките от гласуванията в парламента? А спомняте ли си, че дадох идеи, за няколко интереси неща, които можем да правим с тях? Ето една от тях – събрах всички разпечатки в една голяма Excel таблица и започнах да ги анализирам. Ето някои резултати:

По партии
Реално присъствие Партия Средно послушание
86.6% ГЕРБ 92.6%
87.7% КБ 80.3%
78.6% ДПС 77.4%
83.3% АТАКА 86%
85.2% СК 88.1%

Положително гласуване Активност при гласуване
78.2% ГЕРБ 70.8%
59% КБ 28.2%
65.5% ДПС 19.6%
74.9% АТАКА 37%
71.9% СК 29%

Кой е по-по-най
Най-“непослушни“ от всяка партия
ТАНЧЕВ ГЕРБ 86.3% Участие 43%
ВЕЛИКОВ КБ 56.1% Участие 24%
ДАЛ ДПС 49.1% Участие 14%
ПЕТКОВ АТАКА 55% Участие 30%
АГОВ СК 77.5% Участие 21%
ВАСИЛЕВ НЕЗ 43.7% Участие 12%

Реално присъствие
ДОГАН ДПС 0%
МЕТИН ДПС0%
ИВАНОВ ДПС 14.3%
СЕФЕР ДПС 28.6%
ПЕТКОВ АТАКА 28.6%
ПЕТКОВ ГЕРБ 28.6%

Активност при гласуване
ПЕЕВСКИ ДПС 5.6%
ЛЮТФИ ДПС 9.2%
ПАНТЕВ КБ 9.4%
МЕХМЕДОВ ДПС 9.8%
ЯНЕВ НЕЗ 9.8%
КОСТОВ ГЕРБ 10%

Интересен факт е, че всички от ГЕРБ гласуват в поне 86% от случаите в унисон с партията. При БСП и ДПС „послушността“ започва от 50-те процента, но там данните са по-неточни, заради страшно ниското им участие.

Методология
Данните, които виждате са на базата на 15 заседания между 9 юни и 9 юли. Това са тези, за които са изведени разпечатки откакто промяната в правилника на НС влезе в сила. През това време са гласувани 663 закона. Крайните резултати по партии и депутати може да свалите като таблица от тук.

Послушание
Това мерило е най-трудно за изчисление. То определя колко често даден депутат е гласувал по същият начин, както средното за партията. Много размишлявах как да сметна това и накрая се спрях на следния подход:

Първо смятам как би гласувала партията, ако беше един депутат. Това става като се изчислява вероятността за всяка възможност (Да, Не, Въздържал се) за всеки закон и се избира най-често срещаното гласуване. Ако така обаче са гласували по-малко от 60% от депутатите от тази партия законът се пренебрегва в изчисленията (т.е. все едно не са гласували).

Това възприемам за линия на партията поради единомислие или просто заповед отгоре. След това, за всеки депутат се преброяват колко съвпадения има между неговото гласуване и средното за партията (освен тези, за които не е гласувал и тези под 60% на партията). Така се пресмята колко пъти се е съобразил с мнозинството от групата си.

Реално присъствие
Тук не се осланям само на списъка с неизвинени отсъствия, а на реално подадените гласове. Ако някой депутат е маркиран като присъстващ, но на практика не е гласувал нито един закон през деня, го маркирам като реално отсъстващ. Има случаи, в които някой е отбелязан с неизвинено отсъствие, но е гласувал по-късно през деня. Тези случаи не ги маркирам като отсъствия, защото вероятно депутатът е дошъл по-късно. Най-много такива отсъствия имат Доган и Метин – 15 от 15.

Активност при гласуване
Тук измервам колко закона е гласувал депутатът докато е бил в залата. Това включва дните, в които е дал поне един глас. Поради това, че някои депутати са идвали само няколко дни и са гласували по много, се получава така, че имат по-голяма активност от други, които са седели постоянно в парламента. Така депутатите на ДПС, БСП и СК имат най-ниска средна активност. Случаят с ДПС е най-фрапиращ, защото средно са гласували за по-малко от 2 закона от всеки 10.

Възможности за подобрение
На първо място, това въобще не е представителна извадка, защото от хилядите гласувани закони и десетките заседания, аз взимам само тези от последния месец. За жалост имаме данни само за тях. За щастие обаче, от тук нататък с всяка стенограма ще получаваме такива разпечатки и ще си вадим по-точни изводи.

Формулата за послушанието определено може да се подобри. Примерно може да се сметне средното на партията с вероятности, а не направо с Да/Не. Също така може да се даде тежест на гласовете – за Въздържал се х0.5, а за глас срещу този на партията – х2. Това е защото с обратен глас депутатът реално се противопоставя, а с Въздържал се – просто не им пречи.

Накрая, може да се използва векторен анализ за изчисляване на разстоянието между всеки депутат, да се изчисли векторният център на партията и да е види кои депутати гласуват еднакво. В този случай елементите от векторите ще са законите. Може също така да се сметнат разликите между самите партии, за да се види коя срещу коя е гласувала. За целта обаче ще е най-добре да се напише директно скрипт – било то в Excel или направо на PHP. Това ще е доста по-лесно като излязат разпечатките на XML.

Реалното присъствие и активността може да се подобрят с включване на статистика за изказванията на всеки депутат и участието му/й в комисиите. Това обаче също ще трябва да почака докато стане новият сайт. И сега може да се анализира стенограмата, но ще е твърде трудоемко.

Направих всички изчисления с MS Excell 2010. Започнах с OpenOffice Math но се оказа, че няма функции като SUMIFS, която ми трябваха. Все пак, сега формулите са прекалено големи (десетки милиони събирания на страница) и затова в един момент така или иначе ще трябва да се пренапишат на VBasic или нещо за OpenOffice. Този път просто не ми се занимаваше. Също така може всичко това горе да се покаже с иконография, която стана доста популярен метод за изобразяване на сложна информация. Може да го направя към края на годината, когато имам достатъчно точно данни.

Изводи
Макар и непълна, надявам се, че тази статистика да събуди интереса ви към възможностите на отворените данни. С публикуваните разпечатки на гласуването на депутатите може да следим подробно всяко тяхно решение, да го свържем с естеството на гласуваният закон и да изградим профил на всеки политик. Макар че изграждането на такъв сайт би отнело време, самото изчисление и събиране на информация става автоматично.

А представете си, че имахме достъп и до други такива масиви от данни, като например средната бройка болни, операции и конкретни заболявания по региони; списък с престъпленията разделени по тип и местоположение; подробна информация за харчовете на общините; напредъкът по различни европроекти и т.н.

Ако си мислите, че това е твърде много информация – не е, защото други европейски държави вече ги публикуват. Ако си мислите, че никога в България няма да получим тези данни свободно, пак ще сгрешите. Може да не е утре или вдругиден, но явно е възможно – от НС се съпротивляваха за разпечатките, но пак ги пуснаха.

За статистиката от институциите обаче трябва централно решение (т.е. не на отделни чиновници действащи на добра воля) и принципна политика, която да установява реда, формата и отговорните лица за публикуването на отворени данни. Такива решения винаги се взимат от 2-3-ма човека на възлови позиции и затова трябва да ги намерим и убедим, че си струва. Това все пак е крайната степен на прозрачност, за която толкова много се говори.

Боян Юруков
http://yurukov.net/blog

«