På ett blogginlägg så hittade jag en karta där sympatier för Sverigedemokraterna fanns angivna per kommun.
Bilden hämtad från Charlotta Mellanders blogg: http://www.vertikals.se/charlotta/2013/10/22/sverigedemokraternas-geografi/
Nu skulle det kunna vara vilken typ av karta som helst med statistik och jag har inte heller läst artikeln som jag hämtat kartan ifrån, det är inte det som är det intressanta för mig.
Nej det intressanta är hur vi väljer att åskådliggöra statistik. Börja med att titta på intervallet för de olika färgerna, varför har man valt dessa intervall. Spelar färgskalan någon roll för hur man uppfattar resultatet, tänk dig samma karta fast från rött till grönt…
För att testa lite så gick jag till valmyndighetens hemsida och laddade hem data för valkretsar och xml-filer för valresultatet 2010.
För skojs skull så använder jag röd till grön skalan så får ni själva avgöra om det blir någon skillnad.
Först ut är samma fördelning som i artikeln, nämligen en ”Kvantil” fördelning som innebär att det är lika många värden i varje intervall, hur nu det kan vara logiskt när man redovisar procentuella resultat och inte skördevolymer? Denna skala ”döljer” effektivt resultat som sticker ut från mängden, men det blir lika många fält av varje färg.
Tar man i stället en standardavvikelse som indelning (bild ovan) så skulle det bli mer statistiskt korrekt, men bara om man räknar faktiska röster och inte som här procent. Lite mindre smickrande för Skåne dock.
Ungefär samma resonemang blir det om man väljer ”Natural Breaks”, men då får i alla fall Skåne lite mer sällskap avseende de gröna färgtonerna.
Hoppsan, vad hände här? Kartan blev inte lika mönstrad som tidigare och helt plötsligt så är det bara några få kommuner som sticker ut extra. I kartan ovan har jag använt mig av ”Pretty Breaks” där resultatet redovisas i 5% intervall. För redovisning av ett procentuellt resultat så tycker jag nog att denna indelning är mer rättvisande. Man kan dock fundera på vilket intervall som skall användas.
Går man sedan in på valdistrikt och zoomar in lite på Skåne så framträder ännu en bild.
I denna bild fick jag modifiera färgerna något så att de stämmer någorlunda med färgerna för de tidigare procentangivelserna. Resultat högre än 20 % fick således en ännu mörkare färg. Om jag behållit samma färgskala så hade bilden sett ut som den här nedan, vilket ju blir helt annorlunda.
Jämför de två sista bilderna och lägg märke till att det är exakt samma intervaller i skalan, men olika färger. Detta ger två helt olika intryck bara för att man väljer att ta hänsyn till tidigare resultat, eller inte.
Med detta så hoppas jag att ni tittar lite närmare på redovisning av statistik nästa gång det kommer på tal. Men framför allt så skall ni gå till Valmyndighetens hemsida och hämta hem egna data och testa själva att koppla ihop shapefiler med tabelldata. Källa: http://www.val.se/val/val2010/statistik/index.html
0 svar på ”Statistik, sanning eller förbannad lögn?”