Då har så åter statistik över NATO ländernas försvarsutgifter publicerats. Jag värderar inte innehållet på något sätt, men tar tillfället i akt att omvandla siffror i tabellform till en karta i QGIS, och ger ett tips till de som emellanåt publicerar data i tabellform.
Via Twitter hittade jag till http://www.nato.int/cps/en/natohq/news_132934.htm där det publiceras ett dokument i PDF form med tabeller rörande försvarsutgifter för NATO länderna, på lite olika sätt.
PDF dokument brukar ibland gå att konvertera till andra format, exempelvis genom att markera, kopiera och klistra in exempelvis tabeller i ett kalkylark. Den här gången var det inte så enkelt.
Via ett textdokument och lite redigering så kunde jag dock göra om en av tabellerna till ett format som gick att läsa in i QGIS.
Sedan behöver jag en karta också. Enkla vektordata med världens länder finns exempelvis på http://www.naturalearthdata.com/downloads/110m-cultural-vectors/.
Lagret har massor av attribut och det gäller att hitta ett som passar tabellen med data. Om det är något som saknas så kan man behöva redigera tabellfilen något.
Sedan är det bara en enkel sammanslagning av lager och tabell som återstår.
För att välja stil på lagret så kan man göra på flera olika sätt och resultatet, eller intrycket av kartan påverkas i väldigt stor grad av det val man gör.
Tabellen jag använder beskriver försvarsutgifter i miljoner dollar fördelat på länder. Detta är en väldigt exakt tabell där storheterna inte i sig är en inbördes rangordning, så en sorterande gradering är inte lämplig.
Kvantil (lika antal) fördelning
Bilden ovan ger sken av att USA, Frankrike och Storbrittanien ligger på ungefär samma nivå. Men det stämmer inte.
Öppnar man histogrammet så ser man tydligt att det är ett land som verkligen sticker ut, nämligen USA. Det blir svårt att hitta en skala som belyser en annan skillnad än att USA spenderar mycket mer än övriga, vilket gör att man får vara kreativ.
Jag väljer i stället en skala där utgifterna är fördelade efter en ekonomisk skala med intervall på 10 miljarder dollar. Jag väljer även att plocka ut just USA och ge det en särställning i kartan som ännu tydligare belyser att det är mycket stor skillnad mot övriga NATO länder.
Mer intressant kanske en karta med försvarsutgifter per capita, eller som procent av BNP hade varit mer intressant, men där lyckades jag inte på ett enkelt sätt omvandla PDF filen till tabelldata. Detta kan verka som påminnelse till alla, att om man publicerar öppna data så bör man göra det i format som man kan använda i flera sammanhang. Tabeller bör publiceras som separerade textfiler och inte PDF.