Definitie
Om hier een goed antwoord op te kunnen geven, is een goede definitie van big data een mooi startpunt. Wat verstaan we hier eigenlijk onder? Big data is niet hetzelfde als een grote database. Kenmerkend voor big data is, naast dat het gaat om een grote verzameling van gegevens, deze met grote snelheid automatisch worden gegenereerd.
Een grote database is vergelijkbaar met een grote digitale kaartenbak, een systeem om een grote hoeveelheid gegevens op te slaan. Neem bijvoorbeeld het huurdersbestand van jouw corporatie. Ondanks dat alle gegevens van de huurder digitaal beschikbaar zijn, zijn deze er niet automatisch en met grote snelheid in terecht gekomen. Vaak is er nog handwerk aan te pas gekomen. Veel gegevens heeft de huurder zelf achtergelaten op het moment dat hij/zij zich online inschreef. Andere gegevens zijn aangevuld door een medewerker van de corporatie. Zo ontstaat een grote database van huurdersgegevens met een ontelbaar aantal records.
Big data is anders
De kenmerken van big data vatten we samen volgens de vier V’s: Volume, Variety, Veracity & Velocity. Of in simpel Nederlands: het gaat om veel data, gevarieerd in soort, niet altijd even betrouwbaar en met grote snelheid vernieuwd beschikbaar. De term Big Data gebruiken we voor data die automatisch worden gegenereerd, bijvoorbeeld via kliks, instrumenten of sensoren. We kunnen dan denken aan data afkomstig van social media die real time beschikbaar zijn en steeds weer ververst worden. Of data van GPS systemen die bezoekersstromen meten. Of sensoren die data over de onderhoudsconditie geven. Of data van andere instrumenten zoals de slimme meter in onze meterkast. Een enorme schat aan data die in een rap tempo worden ververst en die soms lastig aan elkaar te koppelen zijn.