Esri släppte sina globala data med ”Land Cover” i 10 meters upplösning i förra veckan, och självklart så laddade jag hem alla 60 Gb (CC-BY). Inte för att jag behöver dem, men…
https://www.arcgis.com/apps/instant/media/index.html?appid=fc92d38533d440078f17678ebc20e8e2
Det går också att använda dessa data via ArcGIS Online om man vill det: https://www.arcgis.com/
Esri har använt 6 av spektralbanden från Sentinel 2 och med hjälp av ett tränat AI värderat data från 2020 utspritt över året med tanke på molntäcke och liknande. Resultatet är 10 klasser för alla landområden globalt. Ett problem när man använder data på detta sättet är att man MÅSTE kompensera för årstider i tempererade zoner. Det verkar dock inte gjorts i detta fall. Visst kan det hända att det är svårt att hitta molnfria scener under samma period på året, men för att kunna använda data av denna typ i våra regioner så behöver vi veta vilket årstid som beskrivs. Personligen tycker jag att alla data av den här typen skall beskriva sommar (snöfritt) och torrt, det vill säga inte efter ett ”monsunregn”. Om det inte är det så måste vi veta det. Man kan visst använda dessa data i olika sammanhang, men man måste värdera trovärdigheten i det aktuella studieområdet och exempelvis jämföra med andra kvalitetssäkrade data.
ESA har sedan 2017 ett projekt med landtäcke som skall vara klart i sommar som också använder Sentinel 2, men som även använder Sentinel 1 (SAR) i kombination med de multispektrala bilderna, vilket potentiellt kan ge ett mera trovärdigt resultat. Det hela beror lite på hur väl Esri lyckats träna sina algoritmer.
Då båda dessa dataset är 10 meter och har global täckning där de i huvudsak är baserade på samma källdata, så skall det bli intressant att se och jämföra resultatet.
Data är i TIFF format, enkelband BYTE, eller 8-bitar, så detta är även ett bra tillfälle att testa denna datatyp i GeoPackage.
Det ”normala” är att data i GeoPackage sparas som en kombination av JPG och PNG med tre eller fyra band (RGBA), vilket också är det som stöds av Esri och ArcGIS Pro, men raster i GeoPackage kan så mycket mera.
För att bevara värdet i dessa ”diskreta” data så fungerar inte ”standard” inställningarna för att konvertera till GeoPackage. Visst det kommer att bli ett resultat som går att visa, om man ”expanderar” till rgba, men framför allt komprimeringar kommer att göra att dessa data blir i praktiken oanvändbara. Så även i de fall data ser OK ut, så är värdet i pixlarna borta.
För Detta så kan man spara som TIFF i stället genom att ange ”TILE_FORMAT” som just ”TIFF” i alternativen för att skapa dessa data vid export. Men det blir ändå inte riktigt bra, sannolikt på grund av komprimering i formatet.
Men det finns ännu en möjlighet som passar ännu bättre i det här fallet, nämligen PNG8, eller 8-bitars PNG. Genom att sätta ”TILE_FORMAT” till ”PNG8” och dessutom ”ZLEVEL” till ”9” för att komprimera maximalt, så kan man bevara allt från källdata utan att något förändras i värde. Jag misstänker att man kan ha lite komprimering för att hålla nere datamängden, men datorn att få jobba lite mera när man skall använda dessa data i olika former av beräkningar, så jag skulle rekommendera så lite komprimering som möjligt, även om jag inte kan se någon större skillnad på originaldata och dessa.
Det hade varit trevligt om det fanns lite fler ”Profiler” än ”Standard” i QGIS från start. En sådan profil hade mycket väl kunnat vara just för diskreta 8-bitars data av den här typen.
Pyramider (overviews) kan vara ”nice” men inte nödvändiga i det här fallet.
Storleken på filerna då? Originalfilen i TIFF är 38.6 Mb i fallet med de testdata som jag använt (endast UTM 32W). Samma data i GeoPackage är 37.1 Mb. Ganska jämförbara med andra ord…
Jag provar även att använda ZLEVEL=6, vilket är standard, och då blir paketet 41.5 Mb, vilket förvånade lite, så jag provade även med ZLEVEL=3. Detta blev 52.4 Mb, så det blir inte väldigt mycket större med mindre komprimering. Någon synbar skillnad i data är det däremot inte.
Kör jag en rasterkalkylator som jämför data pixel för pixel så bekräftas detta och det är 100% överensstämmelse mellan dessa data. Något annat hade jag egentligen inte förväntat, men det är skönt att kunna bekräfta förväntningarna.
Nu återstår att paketera om alla data jag är intresserad av och lägga även dessa data till handlingarna på en lämplig plats på en disk någonstans…