Den här gången tänker jag testa lite olika rasterformat i QGIS. För detta så använder jag höjddata från Lantmäteriet, vilket är 1 band med 32-bitar (float) information.
Till skillnad från bilddata eller raster med färgpalett så är värdena här viktigare, även om det inte är helt avgörande i just det här fallet. Därför blir jämförelsen med originalbilden viktig vid en bedömning av användbarheten.
Jag kommer inte att testa alla möjliga rasterkombinationer, utan jag väljer format som jag tycker är lite mer intressanta, och de standardinställningar dessa har vid export från QGIS. Alla format i GDAL kan sedan anpassas med exempelvis komprimeringsmetod och nivå, men det är en fördjupning som inte hanteras här.
Startläget är som sagt höjddata i GeoTIFF med statistik enligt bilden ovan. Dessa siffror blir användbara vid en jämförelse, men jag kommer även att göra en visuell jämförelse med blandningsläget ”difference”.
De format jag kommer att testa är:
- Erdas Imagine (*.img)
- Extended Dynamic Range Image File Format (*.exr)
- National Imagery Transmission Format (*.ntf)
- NetCDF (*.nc)
- Digital Terrain Elevation Data (*.dt)
Några av dessa är inte direkt avsedda för den här typen av data, men jag tar med dem för att ha lite jämförelser.
Erdas (*.img)
För flera år sedan så stötte jag ofta på det här formatet, men numera är det ganska sällan. Formatet är väldigt flexibelt och är byggt för att hantera geografiska rasterdata, vilket märks.
Överensstämmelsen med GeoTIFF data är 100%, men filen är 18% större, vilket absolut kan vara en nackdel generellt. Sedan kan formatet ha andra fördelar som inte är uppenbara här.
EXR (*.exr)
Detta är ett format som inte är skapat för geografiska data, utan för data inom VFX branschen. Det är företaget Industrial Light and Magic (ILM) som tagit fram formatet för att hantera data med högt dynamiskt omfång (HDR). Detta tillsammans med möjligheterna att anpassa formatet på många sätt har gjort att även GDAL implementerat formatet. Det går att lagre såväl koordinatinformation som pyramider i formatet, därför kan en jämförelse vara intressant här.
Formatet har till skillnad från många andra en komprimering som påverkar datavärden i filen. Det är även visuellt tydligt när man jämför med blandningsläget ”difference”.
Jag är inte säker på hur tydligt det framgår i bilden ovan, men om data var identiska så skulle bilden vara helt svart. Det är den inte riktigt här. Storleken på filen är däremot nästan exakt lika stor som GeoTIFF originalet.
NITF (*.ntf)
Det första problemet med detta format är att det enbart stödjer WGS84 som projektion. Att det sedan främst är avsett att hantera bilddata och inte diskreta data av den här typen gör antagligen formatet direkt olämpligt för ändamålet.
Detta till trots så verkar resultatet helt OK. Det är väldigt god överensstämmelse med originaldata, men filformatet är 13% större i det här fallet.
NetCDF (*.nc)
NetCDF är ett lite annorlunda format som inte heller är direkt gjort för höjddata. Åtminstone inte statiska höjddata. Om man däremot har data som förändras över tid så kan formatet lagra dessa på ett sätt som gör det möjligt att hantera dessa tidsserier i QGIS som ”mesh” lager.
Data i det här fallet kan importeras som ”mesh” eller vanligt raster. För rasterdata så finns det en del avvikelser (nedan), men det är inte så uppenbart när man tittar på blandningsläget difference som för EXR formatet.
Mesh-data är byggt för att hantera vetenskapliga data och har god överensstämmelse med originaldata. Filerna är även i detta fall något större än originalet med 13%.
DTED (*.dt)
DTED är ett dedikerat format för just höjddata, men det har en hel del begränsande förutsättningar som bör vara uppfyllda. Det går att konvertera GeoTIFF till DTED med GDAL, men det blir en del varningar. Formatet utgår från att det är WGS84 data, men även att utsträckningen och skalan följer givna förutsättningar.
Statistiken har god överensstämmelse, men sedan blir det värre. Det är framför allt strukturen i data och koordinatsystem som gör att formatet bara är lämpligt för väldigt specifika data. Att filen är väldigt liten spelar ingen roll, för den innehåller i princip inga data…
Slutsatser
GeoTIFF är bra! Andra format har sina fördelar, men för data av den här typen så finns det inget format av de testade som är bättre. Om motsvarande tester gjorts med andra typer av data, exempelvis flygfoton, så hade säkerligen resultatet blivit annorlunda.
GeoTIFF är ett bra och ganska flexibelt format som dessutom har möjlighet att hantera stora data via servrar på nätverk (COG), och för olika data så kan man justera exempelvis komprimeringstyp och omfattning. Det kan hantera pyramider och koordinatsystem, vilket alltid är bra för rasterdata.
Jag var lite nyfiken på framför allt EXR formatet, som jag använder i andra sammanhang, men det har inte några direkta fördelar i just det här fallet. Dessutom så stödjer inte ArcGIS Pro EXR formatet, medan GeoTIFF har ett bra stöd generellt även i Pro.