Vid all typ av informationshantering är det viktigt att kunna spåra förändringar genom att exempelvis versionshantera dokument. När någon redigerat ett dokument så är det bra att kunna se vilka ändringar som gjorts för att jobba vidare med dokumentet. Har man någon gång redigerat artiklar på Wikipedia så förstår man principen.
För vanliga dokument så finns flera DMS system (document management system) som exempelvis SharePoint och Nuxeo, men för versionshantering av geodata så fungerar dessa väldigt dåligt.
För geodata så finns det nu GeoGit. Det är ett system inspirerat av GitHub framtaget av Boundless och är ännu i sin linda, men verkar lovande. Jag tänkte kortfattat beskriva hur det fungerar, utan att gå in på för mycket detaljer.
För det första så är GeoGit inte en geodatabas som man kan läsa geodata direkt ifrån. Det är däremot enkelt att skapa aktuella versioner av geodata i exempelvis shape-format.
När man skapat ett utrymme (repository) och laddat upp ett startläge för data så kan man bearbeta dessa och göra ändringar utan att den fastställda versionen ändras.
När man sedan är nöjd med sina ändringar, eller om det finns någon som skall granska ändringarna först, så gör man en versionsuppdatering (commit).
Det går även att skapa olika grenar av data (branch) och göra redigeringar och ändringar här. En sådan gren beter sig precis som originalet och kan därför vara ett bra sätt att göra och testa större ändringar med.
Grenar kan sedan slås ihop med originalet igen och det finns flera mekanismer för att hantera datakonflikter som kan ha uppstått på vägen.
Det viktiga är att alla versioner finns sparade i en databas och det går att jämföra data från olika tillfällen för att se vad som ändrats och av vem.
När skall man då använda GeoGit?
Jag tror att ett sätt är att låta ett mindre antal professionella människor sköta och uppdatera en stor gemensam databas, men att genom GeoGit låta vem som helst som hittar fel eller brister redigera och sända in dessa för granskning. Om det verkar stämma så är det bara att göra en ”commit” för att inkludera dessa ändringar. Någon ytterligare redigering krävs ej. Skulle något vara fel så kan man skicka tillbaka synpunkterna till den som gjort underlaget så att de kan göra ändringar tills alla är nöjda.
Än så länge så finns inget snyggt GUI för GeoGit och integrationen i andra system är obefintlig, men jag skulle inte bli förvånad om Boundless bygger in en motsvarande funktionalitet i sin OpenGeoSuite så småningom.
Glad Påsk
Man skulle väl egentligen vilja ha versionshanteringen på varje feature / raster, och då borde de kanske bo i ett ”riktigt” ECM-system, som kan hantera alla filformat & filstorlekar, till skillnad från t.ex. SharePoint och slikt…
Jag är inte riktigt med på hur man skulle uppnå versionshantering på varje feature med ECM om man med feature menar objekt och inte dataset. Med GeoGit är delvis syftet att kunna hantera data på objektnivå och kunna hantera all historik. Ett DMS eller för den delen ECM är helt enkelt inte byggt för det. Jag har heller inte sett den dokumentplattform som hanterar geodata bättre än en rumslig geodatabas.
Jag kan dock förstå nyttan med ECM om man hanterar geodata som produkter och inte som just data. De flesta DMS kan faktiskt ställas in för massor av filformat men riktigt stora filer brukar det vara värre med. Data utspritt på flera filer som i shape är heller ingen höjdare, men är det geodata som produkt så finns ju alltid zip.