Ett förtydligande, det är statistiken som kommer från Migrationsverket, kartorna har jag gjort. Det finns massor med statistik på Migrationsverkets hemsida presenterad på olika sätt, men inte så många kartor. Sida upp och sida ner med till synes oändligt antal tabeller, vilket säkert är viktigt för en politiker eller ”byråkrat”, men för ”vanligt folk” säger en bild desto mer.
I detta inlägg använder jag en av alla dessa tabeller för att visualisera ”Kommunmottagna enligt ersättningsförordningen 2017” och data är uppdaterat den 1 September. Du hittar Migrationsverkets statistik på https://www.migrationsverket.se/Om-Migrationsverket/Statistik/Aktuell-statistik.html
Det finns som sagt massor med statistik och som vanligt så måste man försöka vara objektiv när man väljer hur man presenterar data. I mitt exempel så är det metoden och dessa risker som är fokus. Vill du skapa en egen karta med speciella förutsättningar så borde du kunna använda den metod jag presenterar här.
Tabellen ovan beskriver vad de data jag använder egentligen handlar om. Även detta är en viktig detalj att presentera när man arbetar med statistik. Man måste också kunna hänvisa till källdata (använd länken ovan) för att vem som helst skall kunna granska resultatet. Om man får en karta presenterad som saknar information om källdata, så bör man bli lite extra försiktig.
Jag utgår från data i Excel och sparar den tabell jag valt som ”csv”, det vill säga separerad text. Med Libre Office så är det enkelt att spara en flik som csv och jag gör inga redigeringar av innehållet innan jag sparar.
Innan jag kan presentera data på en karta, så behöver jag en karta att koppla tabellen till. På SCB hemsida så finns det data med bland annat kommunindelning som kan användas för detta (http://www.scb.se/sv_/Hitta-statistik/Regional-statistik-och-kartor/Regionala-indelningar/Digitala-granser/).
I paketet jag hämtar finns faktiskt data i RT90 fortfarande. Är det någon som använder detta?
Inläsning av tabelldata i CSV format är inte speciellt svårt i QGIS. Man skall tänka på att hoppa över lämpligt antal rader så att det blir tydliga kolumnrubriker, och att välja rätt tecken som separerare. Sedan är det bara att markera att det saknas geometri och öppna.
Tabellen går att filtrera i QGIS för att få bort rader som inte behövs. Det går att anpassa filtret om man vill visa statistiken länsvis, eller per kommun. I tabellegenskaperna så använder jag i det här fallet ett filter som tittar i ”field_4” efter om det finns texten ”Delsumma”, vilket sammanfaller med rader som summerar siffror per län.
Sedan gäller det att hitta ett sätt att koppla tabell till geodata, vilket inte alltid är helt självklart. I det här fallet finns det namn på länen i båda dessa, men de ser lite olika ut.
Metoden är därför att skapa ett nytt attribut i den ena tabellen, och i det här fallet skapar jag ett virtuellt fält i statistiktabellen.
Uttrycket skapar ett namn på länet som stämmer överens med geodatafilen. Kopplingen görs sedan genom att peka ut de två attribut som nu skall vara lika i de båda tabellerna med ”Sammanslagningar” i lageregenskaperna för geodatalagret. Skapa bara en ny sammanslagning och peka ut de två kolumner som förhoppningsvis är lika.
Jag tänker testa en intervallstil baserad på totalsumman per län, som kräver siffror som indata. När man importerar data så är det inte säkert att dessa tolkas på rätt sätt och för mig så blev denna kolumn tolkad som text. Detta är dock inga problem med QGIS. Jag kan skapa ett uttryck för för att rensa bort blanka tecken och omvandla texten till heltal.
För att illustrera skillnaden mellan olika sätt att presentera statistiken väljer jag tre olika indelningar.
I den vänstra kartan är data indelat efter jämna intervall i skalan från lägsta till högsta värdet. Detta tar alltså inte hänsyn till en fördelning av data.
I mitten är det lika många värden i varje intervall, vilket är en total anpassning efter en inbördes rangordning av länens mottagande. Antalet är mindre viktigt.
Till höger är det åter igen skalan som är viktig, men här har man lockats att välja intervall som ger en ”snygg” indelning.
En hjälp med att välja indelning får man av histogrammet. Här kan man även göra helt skräddarsydda indelningar. Exempelvis en indelning av den stora andelen lägre värden, samtidigt som de tre stora får en särställning, vilket sedan kan utmärkas med andra färger, om man vill det.
När man inte använder en definierad indelning så måste man på ett eller annat sätt skicka med information om indelningen, så att en användare kan återskapa den.
Om man bara vill presentera statistik så skulle man kunna nöja sig här. Enkelt, svårt att ifrågasätta, tydligt och vetenskapligt, men blir vi klokare? För att visa på nyttan med statistik så behöver man sätta det i förhållande till olika saker. En förutsättning för länen i det här exemplet att ta emot personer kan vara många olika saker. Lämpliga lokaler och boenden, skatteintäkter/invånare, arbetstillfällen, etc är sådant som man kan sätta siffrorna i relation till för att därmed titta på förutsättningarna att ta emot dessa personer.
Det är nu det blir enklare att framföra kritik mot presentationerna eftersom olika individer har olika åsikter om vad som är viktigt för ett bra mottagande. Det man kan göra som GIS-person är att försöka vara så tydlig som möjligt rörande vad det är som presenteras, och helst på ett sätt som i sig inte är värderande. Vill klienten ha specifika förhållanden presenterade så skall man naturligtvis presentera detta, men en medvetenhet om hur lätt det är att ”skapa” det budskap man vill få fram eller något som man omedvetet söker efter, gör det lite enklare att vara objektiv.
I kartan ovan har jag relaterat antalet personer till hur många invånare som redovisas i SCB statistiken för andra kvartalet 2017. För mig så blir därmed skalan i sig mer intressant och ett lika intervall tydliggör vilka län som tar emot fler, eller färre, baserat på befintlig befolkningsmängd. Siffrorna i kartan är i promille, där jag använt antalet ”Kommunmottagna” delat med SCB invånarantal.
Nu sker ju inte mottagandet på länsnivå, utan per kommun. Det var lite enklare att presentera skillnader på länsnivå i exemplet ovan, men det går naturligtvis att göra motsvarande per kommun.
Samma beräkningar som tidigare, men nu fördelat per kommun. Jag har valt ett jämnt intervall i skalan, men då några kommuner stack ut lite så valde jag att markera dessa extra med en röd kantlinje. Detta då det är skillnad till nästa kommun, men färgskillnaden i skalan tydliggör inte detta.
Nu valde jag att endast göra en jämförelse per invånare, för att jag är lat, och för att jag inte får betalt för att göra det här. Andra jämförelser är minst lika viktiga att göra om man vill få en samlad bild av det här, men även alla andra områden som redovisas med statistik.
När man kopplar tabeller till data i QGIS så måste man gå igenom de tabeller som skapas. Det är inte alls säkert att alla poster får en korrekt koppling. Jag fick exempelvis redigera några kommuner manuellt då dessa inte stavades eller namngavs på samma sätt i de olika tabellerna.