Under några år nu så har det talats mer och mer om ”Big Data” och det senaste året så har det formligen exploderat med seminarium, kurser och tjänster som erbjuder lösningen på allas ”Big Data” problem. Men vad är det egentligen, och är det ett problem.
Big Data, eller ”Stora Datamängder” (här använder jag SD) är helt enkelt så mycket data att traditionella metoder för att hantera dessa inte längre fungerar. Dessa data är dessutom under ständig förändring och data kan ändras med en takt av många gigabyte per sekund från tiotusentals källor. Ofta så handlar det om många terabyte eller till och med petabyte, tänk Googles sökdatabas. Det är således inte ett företags samlade kundregister, eller ens ett jätteföretags samlade produktkatalog, dessa är helt enkelt inte tillräckligt stora eller ändras i nämnvärt tempo. Sociala media är en kandidat för SD. Exempelvis så skapas det upp till 3’000 ”tweets” per sekund på Twitter, vilket ganska snabbt skapar stora datamängder, även fast ett meddelande bara är 140 tecken.
Om vi tar Bibeln som exempel så kräver den endast 4 megabyte för att lagras som ren text. Det krävs således en miljon biblar innan man kan börja tala om SD, samtidigt som samma volym skapas var fjärde månad via Twitter. Det är därför inte alls säkert att man ens behöver bry sig om det här med SD bara för att det är stor ”hype” kring begreppet. Om man har problem att hålla ordning på sina data så är det i de flesta fall ”bara” en strategi för informationshantering som behövs. Skall man satsa pengar på något så kanske det är en s.k. IMO (Information Management Officer [mil. term]) som kan strukturera hur information skall flöda och lagras för att vara lätt att få tag på när den behövs. Ett vettigt DMS (document management system) och kanske även ett CMS (Content Management System) kan vara ett första steg för ett företag eller organisation som hittills använd filservrar och Excel för att hantera information och dokument, och upplever att nuvarande system inte fungerar.
Jag tror inte att det är så vansinnigt många som idag behöver bekymra sig om SD, och innan man vet om man behöver det eller ej så skall man absolut inte kasta en massa pengar på begreppet. Börja med att läsa på lite och titta på den egna informationshanteringen och fatta sedan ett välavvägt beslut. Gå inte på ”hypen” om du inte behöver det.