20 januari 2022

De noodzaak van big datamanagement

Data is booming, letterlijk. Elk jaar verdubbelt de hoeveelheid data die we opslaan. Dat betekent dat we in 2014 meer data hebben opgeslagen dan we deden in de periode van de Big Bang tot en met 2013. En in 2015 hebben we weer meer data opgeslagen dan in alle jaren voor 2015. En dat gaat nog wel even zo door. Geen wonder dat we het hebben over ‘big data’. Maar we trekken er de verkeerde conclusies uit.

Er is enorm veel data en we kunnen er steeds meer mee. Processen, de besturing van de organisatie, het begrijpen van onze klanten en het inzicht in het succes van onze producten en diensten, ze drijven allemaal op informatie. Organisaties zijn meer en meer afhankelijk van informatie, en dus van data. Hoe zeker kunnen we zijn over de kwaliteit van data? Wie mag er wel en geen toegang hebben tot specifieke data? Hebben we de data wel goed genoeg beveiligd? En hoe groter de data, hoe groter het belang van die vragen. In de hype rond big data dreigen we over het hoofd te zien dat goed datamanagement aan de basis staat van ondernemingssucces.

Procesdata

Allereerst gebruiken we data steeds intensiever in processen. De kernprocessen van de onderneming zijn in hoge mate afhankelijk van de kwaliteit van de data, maar het merendeel van de relevante informatie ontstaat ook in de kernprocessen. We moeten die kernprocessen dus zo organiseren dat de kwaliteit van die data meteen zo hoog mogelijk is. Het is bijvoorbeeld belangrijk dat degene die de data invoert, zélf belang heeft bij de kwaliteit. Wie heeft er ooit zijn rekeningnummer verkeerd ingevuld als hij geld krijgt?

Daarnaast moeten ondernemingen kunnen aantonen dat informatie op de juiste manier is ontstaan en dat statistieken kloppen. Goede en eenvoudige audit-trails zijn dan van groot belang en daarbij moeten we ook nog rekening houden met samenwerkingspartners, met wie we informatie uitwisselen. De kernprocessen moeten betrouwbaar, voorspelbaar, efficiënt, effectief en transparant zijn, en daarbij speelt de kwaliteit van de procesdata een grote rol. Wie belang heeft bij goede data, zorgt voor goede data, in alle aspecten.

Data-intelligentie

Met behulp van de procesdata kunnen we daarnaast veel inzicht verkrijgen. We kunnen een heleboel ingewikkelde bewerkingen doen op al die data. We kunnen managementinformatie opstellen, reguliere rapporten opstellen en we kunnen onderzoek doen op al die data. Dankzij de data en dankzij het inzicht in die data, kunnen we op bijna alle vragen een antwoord vinden. En als die data van goede kwaliteit is, kunnen we die antwoorden ook nog eens vertrouwen. Dit soort inzichten maken de onderneming data-intelligent, we hebben het niet voor niks over Business Intelligence. We hebben geen keus, als we een intelligente onderneming willen zijn, dan moeten we organiseren dat de data van goede kwaliteit is.

Data science

De nieuwe of echte kracht van big data heet: data science. Deze ‘wetenschap’ stelt ons in staat om, met behulp van big data, meer, betere, gedetailleerder en andere antwoorden te geven op de vragen die we stellen. Het revolutionaire van data science zit hem erin dat we dan ook antwoorden krijgen op vragen die we niet hebben gesteld. Als managementinformatie de onderneming intelligent maakt, dan maakt data science de onderneming slim. Je zou data science dan ook ‘dataslimheid’ kunnen noemen.

Antwoorden

BP (British Petroleum) heeft enorm veel pijpleidingen waar allerlei soorten olie door worden verplaatst. Die pijpleidingen zitten vol met sensors die meten hoe hard de olie stroomt en bijvoorbeeld waarschuwen als er ergens een lek dreigt te ontstaan (procesdata). Maar die sensoren kunnen ook vertellen hoe vaak elke pijpleiding wordt gebruikt en hoe hard de olie stroomt. BP verzamelt al die informatie en op een dag vroegen ze aan de analysetools: zien jullie nog rare dingen? Daar kwam uit dat één specifieke oliesoort verantwoordelijk was voor 80 procent van alle slijtage van die leidingen. Enorm nuttige informatie, maar ze hadden zich bij BP nooit afgevraagd of dat per oliesoort zou kunnen verschillen. De analyse gaf antwoord op een vraag die helemaal niet was gesteld. Dat is de extra kracht van data science. In de competitie van de markt is data-intelligentie niet meer genoeg, je moet ook dataslim zijn.

Big datamanagement

Ondernemingen hebben tegenwoordig enorm veel data en ze kunnen aan nog veel meer data van anderen komen. Met die big data kun je big profit behalen: veel datagebruik in je processen, veel business-intelligentie en veel dataslimheid. Maar ook, als je niet uitkijkt: grote datalekken, grote datavergissingen en grote dataverliezen.

Datagebruik, managementinformatie en data science, ze zijn alle drie belangrijk. Maar ze stellen ook alle drie eisen aan de kwaliteit van de data. Aan de beschikbaarheid, betrouwbaarheid, compleetheid, consistentie en aan de actualiteit. Als de kwaliteit van de data niet goed is, dan neemt de effectiviteit van datagebruik af, dan wordt de onderneming minder data-intelligent en zelfs minder dataslim.

Veel ondernemingen die aan big data gaan doen, steken hun energie in data science en doen dan minder aan datamanagement. Dat is precies wat we niet moeten doen. Als we datamanagement al voor iets willen inruilen, dan moeten we dat doen voor big datamanagement: het managen van al die data. Als je echt iets wilt doen met big data, dan moet je niet alles opzij zetten voor data science.  Dan moet je daarnaast beginnen met groot datamanagement. Niet het managen van grote data, maar het groots managen van je data. Want de kwaliteit van die data staat aan de basis van al die mooie dingen. Datamanagement verhoogt het rendement van procesdata, van data-intelligentie en van dataslimheid. Data wordt voor organisaties net zo belangrijk als geld. Zullen we dan datamanagement voortaan net zo belangrijk gaan vinden als financial management. Voor ‘Follow the money’ hebben we altijd al moeten bouwen op data, maar nu geldt: ‘Follow the data’.

De vergeetplicht

Bovendien is het optimaal gebruiken van data niet genoeg. We moeten ook garant staan voor de veiligheid van data. Dataprotectie wordt steeds belangrijker. We moeten data classificeren, om per klasse de juiste maatregelen te nemen en we moeten ervoor zorgen dat alleen de juiste mensen toegang hebben tot de juiste data. Toen in 1998 Marc Dutroux ontsnapte, bleken 25 Belgische ambtenaren op die dag zijn gegevens te hebben geraadpleegd zonder dat ze die informatie voor hun werk nodig hadden. Ze zijn alle 25 ontslagen. Toen Robin van Persie in 2005 werd verdacht van verkrachting, probeerden meer dan 200 Rotterdamse agenten zijn dossier in te zien. Ze kregen allemaal een waarschuwing. Dat mag niet gebeuren en het mag zelfs niet eens kunnen. Organisaties moeten garant staan voor de privacy van iedereen die in hun bestanden voorkomt en de boetes (en de scha(n)de!) bij verzuim worden steeds groter.

Een relatief nieuw fenomeen is de vergeetplicht. Onder zekere omstandigheden kunnen mensen eisen dat bepaalde gegevens uit de bestanden worden verwijderd en dat een organisatie ook kan aantonen dat dat is gebeurd. Dat kan alleen maar als je daar goed over nadenkt en het goed organiseert.

Risico’s

Big data is een feit, er is heel veel data en daardoor kan er veel veranderen. Processen worden beter, intelligenter en slimmer. De organisatie wordt intelligenter en slimmer. De strategie kan bouwen op degelijke cijfers. Het hebben van veel data biedt enorm veel mogelijkheden en kansen. Maar er kleven zoals gezegd ook steeds meer risico’s aan het hebben van al die data. Dataveiligheid, dataprotectie en privacy moeten goed worden georganiseerd, want de schade aan financiën en imago kan enorm zijn. Er komen allemaal nieuwe verplichtingen bij, zoals  vergeetrecht en audit-trails. Als we die kansen willen benutten, als we die bedreigingen willen weerstaan en als we aan die verplichtingen willen voldoen, dan kunnen we niet meer om datamanagement heen. Datamanagement is big geworden!

Zoals organisaties niet zonder een degelijk financieel systeem kunnen, zo kunnen organisaties tegenwoordig ook niet meer zonder goed en degelijk datamanagement. Financiën en datamanagement vormen samen het fundament van het organisatie. Financiën hebben we meestal goed georganiseerd. Nu datamanagement nog!

 

Terug