De Waarde van Data - Frank Harland (Sogeti)
-
Upload
sogeti-nederland-bv -
Category
Technology
-
view
661 -
download
1
Transcript of De Waarde van Data - Frank Harland (Sogeti)
1
De Waarde van Data
Frank Harland, Consultant Business Intelligence, Sogeti Nederland
Hoe kan waarde toegekend worden aan data- en
Informatie bezittingen. Of moeten we stoppen
met een geldwaarde aan data te hangen.
2
Wat neemt u mee
Wat neemt u mee van deze sessie:
• Waarom zou u wel of geen effort moeten steken in waarderen van uw data bezit.
• Welke methoden kunnen worden gebruikt om de waarde van data en informatie inzichtelijk te maken
3
Agenda
• Wat− Wat versta ik onder data & informatie
− Termen
− Onderzoek
− Zijn data en informatie Activa?
• Waarom
− Waarderen van Data en Informatie
• Hoe
− Waarderings methodes
3
4
Data
• Latijn voor “een gegeven” of “een feit”.
5
Data – Informatie – Kennis - Wijsheid
Toegevoegd: Mensen en actie
Toegevoegd: Mensen en betekenis
Toegepaste kennis
Toegevoegd metadata: Definitie & Presentatie
Begrepen en toegepaste informatie
Heeft toegevoegde waarde wanneer
eenvoudig verkrijgbaar
Data in context. Vb. Telefoonnummer Rest.
Artistos in Lagos is00 351 282 760 659
Kennis heeft alleen waarde wanneer er op
gehandeld wordt
Representatie van Feitenover dingen bijv.
„351282760659‟
Kwaliteitsinformatiebegrepen door mensen,
kan tot waarde leiden
6
Waarde van data
22%
27%
16%
22%
13%
Kritieke bedrijfsactief,
waarde bekend
Enigszins waardevol,
vermoedde waarde
Hulpbronnen voor
applicaties, enige
intrinsieke waarde
Applicatiehulpbronnen
die altijd defect lijken te
zijn
Niet op radarscherm
Onderzoek door Initiate (IBM)
7
Onderzoek
• Analyse:− Bijna 50% zegt het is een actief
• Maar:
− Waarde is wellicht bekend: 22%
− Vermoedde waarde: 43%
− Geen veronderstelde waarde: 35%
− Waarde niet precies bekend: 78%
22%
27%
16%
22%
13%
8
Onderzoek
• Wat denkt u van de inschatting van de ondervraagden?
− Ik concludeer dat in ongeveer 80% van de organisaties de waarde van de informatie niet bekend is.
9
Waarom besteden we …
• Grote sommen aan beveiliging van gegevens die we verder onverschillig behandelen
• Belachelijke hoeveelheden tijd aan het jagen naarontbrekende gegevens
• Waarbij we
− Foute gegevens verbeteren
− “work arounds” bedenken voor incomplete gegevens
− Informatie fabriceren door het aan elkaar te plakken
− Conflicterende gegevens eenduidig proberen te maken
10
Data en informatie als een bedrijfsactief?
Hoeveel mensen in het publiek vinden dat
• Data moet worden behandeld als een bedrijfsactief, net als andere activa?
• Behandelen data binnen hun organisatie als een bedrijfsbezit, een actief?
11
Data en informatie als een bedrijfsactief?
• Moeten we data en informatie behandelen als actief?− Rob Karel, Forrester Research:
◦ No: Data has no intrinsic value. It's not worth the effort trying to assign a monetary value to data records themselves.
− John Ladley, president, IMCue Solutions
◦ No: Data has no value in and of itself. Only when being put to action or you do something with it.
− Accountants: Nee, waarom zou je? Wanneer je data op de balanszet moet je het afschrijven of behandelen als Goodwill. Denk ookaan de belasting!
12
Data en informatie als een bedrijfsactief?
• Moeilijk om de toegekende waarde die bij het record hoort te onderhouden.− Informatiegroepen als geheel bekijken?
− Hoe zit het met de processen die “op de data lopen”?
13
Data en informatie als een bedrijfactief
• Regels van AICPA:
“Genereert mogelijk toekomstig economisch voordeel".
− IMHO Data en informatie vallen in die categorie
• US-GAAP, IFRS BASEL II en Sovency II stellen hogeeisen aan data governance en betrouwbaarheid van data en informatie.
− Nemen aan dat data wordt behandeld als een bedrijfsbezit.
14
DAMA over Data and information als actief
• DAMA Chapter 1 Guide to the DMBOK: − Truly assets; they have business value, tangible or intangible
− Accounting practices consider data as intangible assets
◦ Like software, expert knowledge etc.
15
Agenda
• Wat− Wat versta ik onder data & informatie
− Termen
− Onderzoek
− Zijn data en informatie Activa?
• Waarom
− Waarderen van Data en Informatie
• Hoe
− Waarderings methodes
15
16
Waarom
• -/-− Moeilijk, nog geen tools
− “Hebben nooit zo naar data gekeken”
• + (business drivers)
− Concurrentiekracht
− Compliance
− Risk management
− “We kunnen zien dat data waarde toevoegt aan de organisatie”
17
18
Agenda
• Wat− Wat versta ik onder data & informatie
− Termen
− Onderzoek
− Zijn data en informatie Activa?
• Waarom
− Waarderen van Data en Informatie
• Hoe
− Waarderings methodes
18
19
Soorten gegevenswaarde
• Intrinsieke gegevenswaarde
• Informatieve gegevenswaarde
• Potentiële gegevenswaarde
Klant Product
LevOrg
Feit
dim dim
dimdim
Verkoop
20
Intrinsieke gegevenswaarde
• Kosten impliceren waarde (Noreen Kendle)− Huisvesting, creatie, onderhoud van data en disks kosten echt
geld.
− Waarde gerelateerd aan de inspanning nodig voor opslag, onderhoud van infrastructuur en systemen die bedrijfsgegevens bevatten
21
Informatieve gegevenswaarde
• Objecten door data beschreven− Hebben waarde of potentiële waarde
− Data heeft waarde die naar voren komtwanneer gegevens gebruikt worden
− Waarde gerelateerd aan proces dat het object ondergaat
◦ Vergelijk waarde van data item over kg. goud of kg. veren
◦ Is een data record over een grote klant meer waard dan het record over een kleine nieuwe klant?
Klant Product
LevOrg
Feit
22
Potentiële gegevenswaarde
• De waarde die kan worden gegenereerd − Analyse
− Data mining
− Big Data valt in deze categorie
• Big Data
− “Key basis of competition” (McKinsey)
− “All companies need to take Big Data seriously”
− “Estimate that a retailer using big data to the full, has the potential to increase its operating margin by more than 60 percent”
dim dim
dimdim
Verkoop
23
Methodes
• Gericht op waardetype 1− Kosten gebaseerd
− CRUD of Data (Ladley)
− Kosten van schonen en verplaatsen van gegevens
• Waardetypen 2 & 3
− Discounted Cash Flow model
− Larry Dubov, Informatie Entropie (bottom up)
− MIKE 2.0 (top down)
24
Methodes: gebaseerd op kosten
We meten:− Kosten van toelaten van dubbele records en redundantie
− Kosten van “data afval”, heruitvoer van al het werk, als gevolg van gebrekkige datakwaliteit.
− Kosten van geweigerde transacties plus heruitvoer
− Kosten van fraude
− Kosten van de tijd die nodig is om te zoeken naar informatie omdatmetadata niet goed (genoeg) is. = gem. 30% van de tijd.
− Risico maal kans, in geld uitgedrukt van gemiste kansen door slechte data
25
DAMA kosten van verlies
• Identificeer de impact van ontberen van de huidige data in de huidige kwaliteit
− Welke gevolgen (in %) voor de omzet
− Welke gevolgen (in %) voor kosten
− Welke risico‟s lopen we -> potentiële financiële impact
26
Methode Discounted Cash Flow
• Contante waardeberekening− Gebruikt voor ontwikkelen business cases en vaststellen ROI
− Voorbeeld: inschatting voordelen van MDM implementatie
− MDM impl. – 1 Miljoen plus 500K / jaar
− Kan 2 M omzet / jaar aan 25% marge = 500K opleveren
− Plus kostenbesparing van 500K en debiteuren -/- 100K /jr
− Tel alle verdiensten op en trek MDM operationele kosten af
− DCF zegt dat je de groei van niet geïnvesteerd geld moet meerekenen. Daarmee komt de huidige waarde op 1,93 M. vs 1M.
27
Dubov Informatie entropie
• Bottom up methode
• Token, attribuut, record en recordset niveau
• Complex
− Entropie = centrale meetwaarde om de hoeveelheidinformatiewaarde te bepalen
28
Larry Dubov’s vergelijkingen I
• Entropy is the central measure used in the theory to quantify the amount of information.
• The value of the enterprise party information
• Cost of one bit of useful business information
• The entropy of attribute j.
• Inform. Quality Penalty for a missing Value
• Currency equivalent of missing value
• IQ Penalty when information quality of the data element is less than 1
• Information Penalty for a record
• Aggregated information penalty for the data set
29
Larry Dubov’s vergelijkingen II
• Information Quality at any level of aggregation
• Scored Information Quality
• Estimated Information Entropy by attribute
IQIJ = Score (source value, benchmark
value)/Score (benchmark value,
benchmark value)
30
Dubov’s methode voorwaarden
Om deze theorie in praktijk te brengen moeten de volgende vragen worden beantwoord:
1. Wat wordt als benchmark gebruikt?
2. Hoe moeten de datakwaliteit issues en kosten van de benchmark zélf behandeld worden
3. Gevolgen van data wachttijd (latency)?
31
Application
Frank,
I have a few companies in Finance, Telecom and Insurance where the methodology has been used in practice.
In my role at IBM SWG, as the Director of Master Data Governance, it is my responsibility to define and implement good data governance practices and software products. Quantitative master data governance is one of the primary focuses on IBM in the nextwave of MDM. The coming releases of MDM software will be increasingly heavy on metrics. The metrics under consideration are part of it.
In fact we are demoing a new IBM software asset at the IOD conference this week. The asset/product is called Master Data Policy Hub and it is all about quantitatively defined policies and their monitoring. The metrics I discussed in the blog are not there yet but they are coming next.
Unfortunately I won't be in London but it is certainly a great idea to meet some time soon. Are you planning any trips to the East Coast of the US?
Cheers,
Larry
Lawrence Dubov, Ph.D.Product Director, Master Data GovernanceIBM Software Group, Information Management
Finance, Telecom and Insurance used in practice
Quantitative master data governance is one of the primary focuses
new IBM software asset
The metrics … are coming next
Master Data Policy Hub
32
MIKE 2.0
• Robert Hillard en Sean McClowry− Method for an Integrated Knowledge Environment (MIKE)
− Open source delivery framework for Enterprise Information Management.
− http://mike2.openmethodology.org
33
Methode MIKE 2.0
• Druk de economische waarde van ondernemingsinformatie uit in een percentage van de marktwaarde− Waarde onderneming (Vorg) gebaseerd op Aandeelprijs x aantal
aandelen
− IC: Informatie coëfficient branche gebaseerd op marktonderzoek
− Informatiewaarde(VI) is Marktwaarde * IC:
◦ VI (theoretical) = VOrg x IC
− Informatie Quickscan (IMQS) gebruikt om huidige en toekomstige informatie efficiency te bepalen (IE)
◦ IEcurrent = IMQS current / IMQS Benchmark
◦ IEfuture = IMQS future / IMQS Benchmark
34
Methode MIKE 2.0
• Potentiële waardevermeerdering is te berekenen met:◦ VI (estimated) current = VI (theoretical) x IEcurrent
◦ VI (estimated) future = VI (theoretical) x IEfuture
◦ VI (estimated) Gains = VI (estimated) future - VI (estimated) current
VI = informatiewaarde IE = informatie efficiency
• MIKE 2.0 heeft hiermee berekend dat:
− Bij banken en verzekerings maatschappijen 70-80% van waarde van organisatie in informatie zit.
− Bijvoorbeeld fabricage bedrijven is dat 30-40%
− Telecom & grote retailers: 50-60%
35
Invuloefening
• IT bedrijf Vorg = 500M− Informatie Coefficient (IC) = 20%
− Theoretische waarde informatie = VI (Theoretical) = 500M x 20% = 100 M
− Uit Quickscan komt overall waarde van 0,7 op een schaal van 0-5
− Branche gemiddelde is 1,8
− Informatie Efficiency: IECurrent = 0,7 / 1,8 = 0,389
− Willen naar IE Future: IE Future = 2.5 / 1.8 = 1.389
− VI(Estimated) Huidig: 100 M x 0,389 = 38,9 M
− VI(Estimated) Toekomstig: 100 M x 1,389 = 138, 9 M
− Verschil: 100 Miljoen
36
Why again?
37
Data en informatie als een bedrijfsactief?
Hoeveel mensen in het publiek vinden dat
• Data moet worden behandeld als een bedrijfsactief, net als andere activa?
38