Data management-interview ManageIT

4
Databeheer in vijf lessen Kapitaal, arbeid en natuur (delfstoffen en landbouwgrond) gelden als de drie productiefactoren. Daar moet je tegenwoordig data aan toevoegen. Grote hoeveelheden gegevens vormen een productiefactor zonder weerga. Maar daar moet je wel goed mee omgaan. Marc Govers van Sogeti geeft een minicursus datamanagement. Govers heeft ‘management consultant’ op zijn visitekaartje staan. Hij werkt bij de afdeling Business Intelligence & Analytics. Tijdens zijn hele werkzame leven heeft hij zo ongeveer tussen databases en datawarehouses doorgebracht. De Mr. Data van Sogeti. De term ‘data management’, zo onderwijst hij, is al heel oud. Die stamt uit de jaren tachtig van de vorige eeuw. “Het had toen veel potentie, maar is uiteindelijk destijds niet doorgedrongen tot de standaard inrichting van automatiseringsstructuren. Dat databeheer mislukte, kwam eigenlijk omdat het vooral een IT-feestje was. Terwijl dit aspect juist op het bordje van de business hoort te liggen. Daar weten ze wat je kunt doen met informatie.” Het idee toen was: je hebt heel veel data, die stop je allemaal bij elkaar in een grote, centrale database (een datawarehouse) en dan verbind je alle gegevens aan elkaar, zodat je waardevolle bedrijfsinformatie krijgt. Dat is natuurlijk een hopeloze zaak. Want ten eerste heb je niet alle data nodig en ten tweede maak je het beheer van de data op deze manier gigantisch complex”, luidt Govers’ vernietigende oordeel. “De belofte was groot. Helaas is die destijds niet waargemaakt.” Eén keer opslaan Tegenwoordig staat het onderwerp weer bovenaan op de agenda. We spreken zelfs van big data. In tegenstelling tot decennia terug zit nu de marketingafdeling bovenop de data of de financiële afdeling. Data is een corporate asset geworden; een productiefactor. “Veel banken bijvoorbeeld zetten tegenwoordig datagerichte dienstverlening in. Daartoe zijn ze bezig met het opzetten van een data- infrastructuur. Dan gaat het niet alleen om de technische infrastructuur, maar evenzeer om de functionele architectuur: welke data heb je, wat kun je ermee doen? Daarbij moet je het geheel zo inrichten dat het heel snel kan inspelen op veranderingen. Want de business verandert voortdurend. Markten wijzigen, de overheden stellen andere regels en consumptiepatronen gaan voortdurend een andere richting op. Daar wil je niet door worden verrast; je wilt dat zien aankomen. En je wilt weten of er nieuwe kansen ontstaan bij veranderd overheidsbeleid. De antwoorden vind je in die berg gegevens; in- en extern.”

Transcript of Data management-interview ManageIT

Page 1: Data management-interview ManageIT

Databeheer in vijf lessen

Kapitaal, arbeid en natuur (delfstoffen en landbouwgrond) gelden als de drie productiefactoren. Daar moet je tegenwoordig data aan toevoegen. Grote hoeveelheden gegevens vormen een productiefactor zonder weerga. Maar daar moet je wel goed mee omgaan. Marc Govers van Sogeti geeft een minicursus datamanagement.

Govers heeft ‘management consultant’ op zijn visitekaartje staan. Hij werkt bij de afdeling Business Intelligence & Analytics. Tijdens zijn hele werkzame leven heeft hij zo ongeveer tussen databases en datawarehouses doorgebracht. De Mr. Data van Sogeti. De term ‘data management’, zo onderwijst hij, is al heel oud. Die stamt uit de jaren tachtig van de vorige eeuw. “Het had toen veel potentie, maar is uiteindelijk destijds niet doorgedrongen tot de standaard inrichting van automatiseringsstructuren. Dat databeheer mislukte, kwam eigenlijk omdat het vooral een IT-feestje was. Terwijl dit aspect juist op het bordje van de business hoort te liggen. Daar weten ze wat je kunt doen met informatie.”Het idee toen was: je hebt heel veel data, die stop je allemaal bij elkaar in een grote, centrale database (een datawarehouse) en dan verbind je alle gegevens aan elkaar, zodat je waardevolle bedrijfsinformatie krijgt. Dat is natuurlijk een hopeloze zaak. Want ten eerste heb je niet alle data nodig en ten tweede maak je het beheer van de data op deze manier gigantisch complex”, luidt Govers’ vernietigende oordeel. “De belofte was groot. Helaas is die destijds niet waargemaakt.”

Eén keer opslaanTegenwoordig staat het onderwerp weer bovenaan op de agenda. We spreken zelfs van big data. In tegenstelling tot decennia terug zit nu de marketingafdeling bovenop de data of de financiële afdeling. Data is een corporate asset geworden; een productiefactor. “Veel banken bijvoorbeeld zetten tegenwoordig datagerichte dienstverlening in. Daartoe zijn ze bezig met het opzetten van een data-infrastructuur. Dan gaat het niet alleen om de technische infrastructuur, maar evenzeer om de functionele architectuur: welke data heb je, wat kun je ermee doen? Daarbij moet je het geheel zo inrichten dat het heel snel kan inspelen op veranderingen. Want de business verandert voortdurend. Markten wijzigen, de overheden stellen andere regels en consumptiepatronen gaan voortdurend een andere richting op. Daar wil je niet door worden verrast; je wilt dat zien aankomen. En je wilt weten of er nieuwe kansen ontstaan bij veranderd overheidsbeleid. De antwoorden vind je in die berg gegevens; in- en extern.”

De grap van data is, volgens Govers, dat je ze voor meerdere dingen kunt gebruiken. “Als je mijn geboortedatum weet, dan kun je daar heel veel aan afleiden. Zeker als je dat dan ook nog eens koppelt aan de plek waar ik woon. Je weet wanneer ik met pensioen ga, etcetera. Nu zijn die gegevens vaak opgenomen in een database die bij een bepaald proces hoort. Zo zie je dat bijvoorbeeld klantgegevens in tientallen databases voorkomen; vaak nog eens anders geformuleerd. En het is foutgevoelig. Aan de ontdubbeling van gegevens wordt nu hard gewerkt. Dat is misschien wel les één: zorg dat je gegevens maar één keer opslaat. Zorg er tevens voor dat ze toegankelijk zijn voor de business wanneer die daar behoefte aan heeft.”

Verschillende bronnenEen goed beheer begint met het in kaart brengen van de verschillende bronnen voor data die bij een organisatie passen. Dat begint met de interne systemen. Daar komen de data op het internet bij, zoals de gigantische hoeveelheden data van social media. Overheden moeten vaak aansluiten op basisregistraties. En dan heb je nog de data van klanten, van leveranciers en hun afnemers. “Als je daar slim mee omgaat, dan bereik je concurrentievoordeel”, is Govers’ overtuiging.Rijkswaterstaat heeft vijf miljoen geïnvesteerd in een datamanagement project. “Maar dat levert jaarlijks 600 miljoen euro op”, onderstreept hij het belang van goed databeheer. “De CEO van Shell mikt er tegenwoordig op nieuwe olievoorraden te vinden door zijn systemen na te vlooien. Niet door

Page 2: Data management-interview ManageIT

mensen erop uit te sturen en geofysisch onderzoek te laten doen in het veld. Nee, door alle beschikbare gegevens te analyseren. Door bijvoorbeeld op een nieuwe manier aan te kijken tegen ooit afgekeurde bronnen.”Een ander voorbeeld is mijnpensioenoverzicht.nl. Door slimme koppeling van gegevens kan iemand precies nagaan hoe het er met zijn pensioen voorstaat.

KwaliteitHet managen van data betekent zorgdragen voor de kwaliteit ervan, de beschikbaarheid en zorgen dat data op locaties komt waar het nodig is. “Kernwoorden bij beheer zijn beschikbaarheid, actualiteit, verrijking met gegevens uit externe bronnen, compleetheid en juistheid”, stelt Govers.Processen binnen organisaties veranderen geregeld. Maar data zijn vrij stabiel. “Dus als je dat één keer goed regelt, dan heb je er vrijwel geen omkijken meer naar. Goed modelleren, goed structureren en goed opslaan. Daarmee heb je voor tientallen jaren plezier.”Je moet data aandacht geven. Zowel op corporate niveau (strategisch en beleidsbepalend) als op operationeel niveau. Dat laatste valt uiteen in twee componenten. Enerzijds ervoor zorgen dat de kwaliteit van de data goed is. Anderzijds erop toezien dat gegevens dusdanig in databases worden opgeslagen dat iedereen in de organisatie die er baat bij heeft, toegang heeft tot die gegevens.Veel organisaties doen er goed aan eerst de kwaliteit van de data op orde te brengen. Er zijn veel dubbelingen, en wisselende noteringen van een en hetzelfde object (zoals een naam of functie). “Negentig procent van de organisaties heeft haar data niet op orde. Die moeten eerst de rommelzolder maar eens opruimen. En dat gebeurt nu ook, want de business hijgt de IT-afdeling in de nek.”

Wat is belangrijk?Het toegankelijk maken van data is nog helemaal niet zo makkelijk, vindt Govers. Want de gegevens zitten opgeslagen in legio databases binnen de onderneming die nauwelijks met elkaar te rijmen zijn. “Dat betekent dat je de data die echt belangrijk zijn voor de onderneming centraal moet gaan stellen. In het onderwijs zijn gegevens over leerlingen van doorslaggevend belang, maar de data over de lunches zijn helemaal niet belangrijk voor de bedrijfsvoering. Dus moet je op corporate niveau vaststellen welke data van belang zijn.”Er is een onderscheid te maken in masterdata: dat zijn de gegevens die in tachtig procent van de bedrijfsprocessen nodig zijn. En secundaire data die minder belangrijk zijn en dus minder aandacht behoeven.“Bij de masterdata kun je nog een onderscheid maken in de snelheid waarmee ze beschikbaar moet zijn. Sommige data wil je realtime weten, andere maar eens in de maand. Als je een internetbedrijf bent, en de klant vult online een aanvraagformulier in voor een product, dan moet hij direct respons hebben. Logistieke medewerkers daarentegen willen weten hoe het met de voorraden staat. Snel maar realtime inzicht is geen absolute must. Dus dat vraagt dan weer om een andere infrastructuur.”

Extra aandacht“Bij onze klanten zien we dat ze meer concurrentievoordeel hebben met meer nuttige informatie. Of dat ze veel efficiënter kunnen werken zoals bij de overheid. Daarom hoort databeheer echt thuis bij de business”, constateert Govers.Een aspect dat tegenwoordig extra aandacht vraagt bij datamanagement is het feit dat (veel) data in de cloud staan opgeslagen. “Dan moet je dus goede afspraken maken over de kwaliteitsaspecten die je gewaarborgd wil zien. Denk aan tijdigheid, beschikbaarheid. Bovendien heb je dan weer een koppeling extra tussen applicatie en data, terwijl je zou moeten streven naar zo min mogelijk interfaces. Die aspecten moet je meenemen bij de overweging om clouddiensten af te nemen; en bij de inrichting van de master data management infrastructuur.”

[kaderkop]80 – 20 regel

Page 3: Data management-interview ManageIT

[kadertekst]De 80 – 20 regel is in veel gevallen toepasbaar. Zo ook bij datamanagement. Want dan gaat het om het beheer van de data die er werkelijk toe doen voor de bedrijfsvoering. Over het algemeen is twintig procent van de data zinvol voor tachtig procent van de toepassingen binnen een organisatie.Dat betekent dat slechts twintig procent van de data beheer nodig heeft, en niet de volle honderd procent zoals nu met databases en datawarehouses.

[kaderkop]Kwaliteitseisen[kadertekst]Er zijn meerdere aspecten die de kwaliteit van data bepalen. Tijdigheid is er een van: hoe snel moeten de gegevens beschikbaar zijn? In de online wereld vrijwel altijd real time.De beschikbaarheid zelf is een kwaliteitsaspect: de gegevens moeten gewoon op die plek opvraagbaar zijn waar de organisatie er behoefte aan heeft.Juistheid is een belangrijk aspect. Als Marc in de ene database met een ‘c’ is opgenomen en in een andere met een ‘k’, dan heb je al problemen.Compleetheid: klantgegevens zonder het bankrekeningnummer bijvoorbeeld boeten sterk aan waarde in voor het bedrijf.De referentiële integriteit is een bijzonder kwaliteitsaspect. Het komt erop neer dat aan data is te zien of het goed of fout is. Dat is alleen mogelijk als de data in context staat. Een modelmatige opzet is dan onvermijdelijk.

======================