DDMA 3 maart 2009 Human Inference over Datakwaliteit
description
Transcript of DDMA 3 maart 2009 Human Inference over Datakwaliteit
Event: DDMA Seminar
Thema: Datakwaliteit
Spreker: Holger Wandt – Human Inference
Datum: 3 maart 2009 – Pakhuis de Zwijger, A’dam
www.ddma.nl
Datakwaliteit – de essentie van
operationele data governance
DDMA-seminar 10 maart 2009Holger WandtPrincipal advisor
Definities
• Datakwaliteit is de mate waarin het geheel van eigenschappen en kenmerken van de gegevens voldoen aan het doel van het gebruik en de verwachting van de ontvanger.
• Data Governance is het geheel aan verantwoordelijkheden en besluitvormingsprocessen voor het kwalititeitsgeoriënteerd management van gegevens.
• Data Stewardship is een deelaspect van data governance, namelijk de formalisering van de verantwoordelijkheden voor het management van data.
Regional livestock operations & analysis manager
Livestock directional assistant
Regional grassland engineers
Soundbytes
• “Jullie data is niet in het juiste formaat.”• “Ik heb de gegevens niet op tijd ontvangen.”• “Wie is verantwoordelijk voor de kwaliteit van de
klantgegevens?”• “Wij weten dat de gegevens onjuist zijn, maar we mogen ze
niet veranderen.”• “Ik heb zelf de data gewijzigd; er stonden te veel fouten
in…” • “Weet je wel hoeveel tijd het ons kost om die
samengevoegde data te ontdubbelen?”• “De aangeleverde gegevens zijn niet consistent.”• “De aangeleverde gegevens zijn onvolledig. Hier kunnen we
niets mee….. “
Dat betekent o.a.
• Problemen bij data capture:– Verschillende bronnen, verschillende formaten,
beschikbaarheid, verschillende inhoud• Problemen bij data-integratie:
– Niet-compatibele bestanden, foute samenvoeging van gegevens, veel handmatige nabewerkingen
• Problemen bij dataconsolidatie:– Autonome correcties, informele, ongestructureerde
afstemming, autonome verrijking van gegevens• Problemen bij dataverstrekking:
– Wantrouwen t.a.v. de kwaliteit van data; gegevens worden niet of verkeerd gebruikt
In de organisatie:
• Ontbrekende of onduidelijke verantwoordelijkheden
• “Silodenken”• Databaasjes• Communicatie ontbreekt of is ad hoc-/consensus-
georiënteerd• Onbegrip• Onduidelijke rolverdeling• Kennis en/of training is niet toereikend De beste spelers vormen per definitie nog niet het beste
team….
Realiteit?
• Onderzoek Harris Interactive in 2006 onder 23.000 employees in “key industries”:– Slechts 37% begrijpt goed wat hun onderneming
tracht te bereiken en waarom.– .Slechts 20% begrijpt het direkte verband tussen
hun werkzaamheden en de organisatiedoelstellingen.
– Slechts 15% heeft het gevoel dat de onderneming hen in staat stelt om hun taken optimaal uit te voeren.
– Slechts 20% vertrouwd de onderneming, waarvor zij werken, volledig.
De optimale organisatie?
Systemen
Mensen Processen
DQ DG
Data governance verantwoorde-lijkheidsmatrix binnen DQM
ROLLEN
TAKEN BINNEN DQM
VERANTWOORDELIJKHEDEN (TOEKENNEN VAN ROLLEN AAN TAKEN)
Toewijzing van verantwoordelijkheden aan rollen: de RACI- notatieResponsible –rollen die bepaalde taken uitvoeren
of zorgen voor de uitvoering van die taken
Accountable – rollen die toestemming geven voor (deel)taken
Consulted – rollen die specifieke vakkennis bijdragen
Informed – rollen die over bepaalde beslissingen en resultaten geïnformeerd worden
Operational data governance - exampleTasks Roles
Chief data steward
Technical data steward
Master data unit head
Business process owners
Legal entity
Service provider
Uitvoering performance-verbeterings-proces
R
Ontwikkeling MD tools en applicaties
A R A/C C
Onderhoud technische systeem-architectuur
R I C
Project- management
R C C C C
Technische ondersteu-ning
R C
Business support RTraining C C R C C
“We have learned to live in a world with mistakes and defects as if they are necessary to life. It is time to adopt a new philosophy”
W.E. Deming 1900 – 1993Statisticus en kwaliteitsguru
De data steward (verantwoordelijk voor het management van data)
KEUZE
Beschrijving Procesimpact Kosten
Winst of verlies
A Verzamel meer data/informatie
Laag €1000.-
- 0 -
B Pilotproject Gemiddeld €2000.-
Correcte voorspeling
+ €3000.-
Foute voorspelling
- €3000.-
C Volledige implementatie
Hoog €5000.-
Correcte voorspeling
+ €20.000
Foute voorspelling
- €20.000
1, 2, 6, …..
Correcte gegevens leiden tot beter beheersbare processen: 1, 2, 6, ....
KEUZE
Beschrijving Procesimpact Kosten
Winst of verlies
A Verzamel meer data/informatie
Laag €1000.-
- 0 -
B Pilotproject Gemiddeld €2000.-
Correcte voorspeling
+ €3000.-
Foute voorspelling
- €3000.-
C Volledige implementatie
Hoog €5000.-
Correcte voorspeling
+ €20.000
Foute voorspelling
- €20.000
1, 2, 6, 7
Correcte data en goede processen leiden tot succes: 1, 2, 6, 7, ......
KEUZE
Beschrijving Procesimpact Kosten
Winst of verlies
A Verzamel meer data/informatie
Laag €1000.-
- 0 -
B Pilotproject Gemiddeld €2000.-
Correcte voorspeling
+ €3000.-
Foute voorspelling
- €3000.-
C Volledige implementatie
Hoog €5000.-
Correcte voorspeling
+ €20.000
Foute voorspelling
- €20.000
1, 2, 6, 7, 11
“Datakwaliteit is ieders verantwoordelijkheid!”
Datakwaliteitsmanagement kan niet zonder data governance en data governance kan niet zonder datakwaliteitsmanagement
DQ & DG Recursieve afhankelijkheid
Ondernemings-strategie
Omvang onderneming
Processen
Organisatie-structuur
Expertise
Systemen
DQ & data
governance
Zonder een goed evenwicht tussen besluitvormings-processen, betrouwbare data en belegde verantwoordelijkheden is kwalitatief management van gegevens een utopie.
Value your data