De Waarde van Data - Frank Harland (Sogeti)

38
1 De Waarde van Data Frank Harland, Consultant Business Intelligence, Sogeti Nederland Hoe kan waarde toegekend worden aan data- en Informatie bezittingen. Of moeten we stoppen met een geldwaarde aan data te hangen.

Transcript of De Waarde van Data - Frank Harland (Sogeti)

Page 1: De Waarde van Data - Frank Harland (Sogeti)

1

De Waarde van Data

Frank Harland, Consultant Business Intelligence, Sogeti Nederland

Hoe kan waarde toegekend worden aan data- en

Informatie bezittingen. Of moeten we stoppen

met een geldwaarde aan data te hangen.

Page 2: De Waarde van Data - Frank Harland (Sogeti)

2

Wat neemt u mee

Wat neemt u mee van deze sessie:

• Waarom zou u wel of geen effort moeten steken in waarderen van uw data bezit.

• Welke methoden kunnen worden gebruikt om de waarde van data en informatie inzichtelijk te maken

Page 3: De Waarde van Data - Frank Harland (Sogeti)

3

Agenda

• Wat− Wat versta ik onder data & informatie

− Termen

− Onderzoek

− Zijn data en informatie Activa?

• Waarom

− Waarderen van Data en Informatie

• Hoe

− Waarderings methodes

3

Page 4: De Waarde van Data - Frank Harland (Sogeti)

4

Data

• Latijn voor “een gegeven” of “een feit”.

Page 5: De Waarde van Data - Frank Harland (Sogeti)

5

Data – Informatie – Kennis - Wijsheid

Toegevoegd: Mensen en actie

Toegevoegd: Mensen en betekenis

Toegepaste kennis

Toegevoegd metadata: Definitie & Presentatie

Begrepen en toegepaste informatie

Heeft toegevoegde waarde wanneer

eenvoudig verkrijgbaar

Data in context. Vb. Telefoonnummer Rest.

Artistos in Lagos is00 351 282 760 659

Kennis heeft alleen waarde wanneer er op

gehandeld wordt

Representatie van Feitenover dingen bijv.

„351282760659‟

Kwaliteitsinformatiebegrepen door mensen,

kan tot waarde leiden

Page 6: De Waarde van Data - Frank Harland (Sogeti)

6

Waarde van data

22%

27%

16%

22%

13%

Kritieke bedrijfsactief,

waarde bekend

Enigszins waardevol,

vermoedde waarde

Hulpbronnen voor

applicaties, enige

intrinsieke waarde

Applicatiehulpbronnen

die altijd defect lijken te

zijn

Niet op radarscherm

Onderzoek door Initiate (IBM)

Page 7: De Waarde van Data - Frank Harland (Sogeti)

7

Onderzoek

• Analyse:− Bijna 50% zegt het is een actief

• Maar:

− Waarde is wellicht bekend: 22%

− Vermoedde waarde: 43%

− Geen veronderstelde waarde: 35%

− Waarde niet precies bekend: 78%

22%

27%

16%

22%

13%

Page 8: De Waarde van Data - Frank Harland (Sogeti)

8

Onderzoek

• Wat denkt u van de inschatting van de ondervraagden?

− Ik concludeer dat in ongeveer 80% van de organisaties de waarde van de informatie niet bekend is.

Page 9: De Waarde van Data - Frank Harland (Sogeti)

9

Waarom besteden we …

• Grote sommen aan beveiliging van gegevens die we verder onverschillig behandelen

• Belachelijke hoeveelheden tijd aan het jagen naarontbrekende gegevens

• Waarbij we

− Foute gegevens verbeteren

− “work arounds” bedenken voor incomplete gegevens

− Informatie fabriceren door het aan elkaar te plakken

− Conflicterende gegevens eenduidig proberen te maken

Page 10: De Waarde van Data - Frank Harland (Sogeti)

10

Data en informatie als een bedrijfsactief?

Hoeveel mensen in het publiek vinden dat

• Data moet worden behandeld als een bedrijfsactief, net als andere activa?

• Behandelen data binnen hun organisatie als een bedrijfsbezit, een actief?

Page 11: De Waarde van Data - Frank Harland (Sogeti)

11

Data en informatie als een bedrijfsactief?

• Moeten we data en informatie behandelen als actief?− Rob Karel, Forrester Research:

◦ No: Data has no intrinsic value. It's not worth the effort trying to assign a monetary value to data records themselves.

− John Ladley, president, IMCue Solutions

◦ No: Data has no value in and of itself. Only when being put to action or you do something with it.

− Accountants: Nee, waarom zou je? Wanneer je data op de balanszet moet je het afschrijven of behandelen als Goodwill. Denk ookaan de belasting!

Page 12: De Waarde van Data - Frank Harland (Sogeti)

12

Data en informatie als een bedrijfsactief?

• Moeilijk om de toegekende waarde die bij het record hoort te onderhouden.− Informatiegroepen als geheel bekijken?

− Hoe zit het met de processen die “op de data lopen”?

Page 13: De Waarde van Data - Frank Harland (Sogeti)

13

Data en informatie als een bedrijfactief

• Regels van AICPA:

“Genereert mogelijk toekomstig economisch voordeel".

− IMHO Data en informatie vallen in die categorie

• US-GAAP, IFRS BASEL II en Sovency II stellen hogeeisen aan data governance en betrouwbaarheid van data en informatie.

− Nemen aan dat data wordt behandeld als een bedrijfsbezit.

Page 14: De Waarde van Data - Frank Harland (Sogeti)

14

DAMA over Data and information als actief

• DAMA Chapter 1 Guide to the DMBOK: − Truly assets; they have business value, tangible or intangible

− Accounting practices consider data as intangible assets

◦ Like software, expert knowledge etc.

Page 15: De Waarde van Data - Frank Harland (Sogeti)

15

Agenda

• Wat− Wat versta ik onder data & informatie

− Termen

− Onderzoek

− Zijn data en informatie Activa?

• Waarom

− Waarderen van Data en Informatie

• Hoe

− Waarderings methodes

15

Page 16: De Waarde van Data - Frank Harland (Sogeti)

16

Waarom

• -/-− Moeilijk, nog geen tools

− “Hebben nooit zo naar data gekeken”

• + (business drivers)

− Concurrentiekracht

− Compliance

− Risk management

− “We kunnen zien dat data waarde toevoegt aan de organisatie”

Page 17: De Waarde van Data - Frank Harland (Sogeti)

17

Page 18: De Waarde van Data - Frank Harland (Sogeti)

18

Agenda

• Wat− Wat versta ik onder data & informatie

− Termen

− Onderzoek

− Zijn data en informatie Activa?

• Waarom

− Waarderen van Data en Informatie

• Hoe

− Waarderings methodes

18

Page 19: De Waarde van Data - Frank Harland (Sogeti)

19

Soorten gegevenswaarde

• Intrinsieke gegevenswaarde

• Informatieve gegevenswaarde

• Potentiële gegevenswaarde

Klant Product

LevOrg

Feit

dim dim

dimdim

Verkoop

Page 20: De Waarde van Data - Frank Harland (Sogeti)

20

Intrinsieke gegevenswaarde

• Kosten impliceren waarde (Noreen Kendle)− Huisvesting, creatie, onderhoud van data en disks kosten echt

geld.

− Waarde gerelateerd aan de inspanning nodig voor opslag, onderhoud van infrastructuur en systemen die bedrijfsgegevens bevatten

Page 21: De Waarde van Data - Frank Harland (Sogeti)

21

Informatieve gegevenswaarde

• Objecten door data beschreven− Hebben waarde of potentiële waarde

− Data heeft waarde die naar voren komtwanneer gegevens gebruikt worden

− Waarde gerelateerd aan proces dat het object ondergaat

◦ Vergelijk waarde van data item over kg. goud of kg. veren

◦ Is een data record over een grote klant meer waard dan het record over een kleine nieuwe klant?

Klant Product

LevOrg

Feit

Page 22: De Waarde van Data - Frank Harland (Sogeti)

22

Potentiële gegevenswaarde

• De waarde die kan worden gegenereerd − Analyse

− Data mining

− Big Data valt in deze categorie

• Big Data

− “Key basis of competition” (McKinsey)

− “All companies need to take Big Data seriously”

− “Estimate that a retailer using big data to the full, has the potential to increase its operating margin by more than 60 percent”

dim dim

dimdim

Verkoop

Page 23: De Waarde van Data - Frank Harland (Sogeti)

23

Methodes

• Gericht op waardetype 1− Kosten gebaseerd

− CRUD of Data (Ladley)

− Kosten van schonen en verplaatsen van gegevens

• Waardetypen 2 & 3

− Discounted Cash Flow model

− Larry Dubov, Informatie Entropie (bottom up)

− MIKE 2.0 (top down)

Page 24: De Waarde van Data - Frank Harland (Sogeti)

24

Methodes: gebaseerd op kosten

We meten:− Kosten van toelaten van dubbele records en redundantie

− Kosten van “data afval”, heruitvoer van al het werk, als gevolg van gebrekkige datakwaliteit.

− Kosten van geweigerde transacties plus heruitvoer

− Kosten van fraude

− Kosten van de tijd die nodig is om te zoeken naar informatie omdatmetadata niet goed (genoeg) is. = gem. 30% van de tijd.

− Risico maal kans, in geld uitgedrukt van gemiste kansen door slechte data

Page 25: De Waarde van Data - Frank Harland (Sogeti)

25

DAMA kosten van verlies

• Identificeer de impact van ontberen van de huidige data in de huidige kwaliteit

− Welke gevolgen (in %) voor de omzet

− Welke gevolgen (in %) voor kosten

− Welke risico‟s lopen we -> potentiële financiële impact

Page 26: De Waarde van Data - Frank Harland (Sogeti)

26

Methode Discounted Cash Flow

• Contante waardeberekening− Gebruikt voor ontwikkelen business cases en vaststellen ROI

− Voorbeeld: inschatting voordelen van MDM implementatie

− MDM impl. – 1 Miljoen plus 500K / jaar

− Kan 2 M omzet / jaar aan 25% marge = 500K opleveren

− Plus kostenbesparing van 500K en debiteuren -/- 100K /jr

− Tel alle verdiensten op en trek MDM operationele kosten af

− DCF zegt dat je de groei van niet geïnvesteerd geld moet meerekenen. Daarmee komt de huidige waarde op 1,93 M. vs 1M.

Page 27: De Waarde van Data - Frank Harland (Sogeti)

27

Dubov Informatie entropie

• Bottom up methode

• Token, attribuut, record en recordset niveau

• Complex

− Entropie = centrale meetwaarde om de hoeveelheidinformatiewaarde te bepalen

Page 28: De Waarde van Data - Frank Harland (Sogeti)

28

Larry Dubov’s vergelijkingen I

• Entropy is the central measure used in the theory to quantify the amount of information.

• The value of the enterprise party information

• Cost of one bit of useful business information

• The entropy of attribute j.

• Inform. Quality Penalty for a missing Value

• Currency equivalent of missing value

• IQ Penalty when information quality of the data element is less than 1

• Information Penalty for a record

• Aggregated information penalty for the data set

Page 29: De Waarde van Data - Frank Harland (Sogeti)

29

Larry Dubov’s vergelijkingen II

• Information Quality at any level of aggregation

• Scored Information Quality

• Estimated Information Entropy by attribute

IQIJ = Score (source value, benchmark

value)/Score (benchmark value,

benchmark value)

Page 30: De Waarde van Data - Frank Harland (Sogeti)

30

Dubov’s methode voorwaarden

Om deze theorie in praktijk te brengen moeten de volgende vragen worden beantwoord:

1. Wat wordt als benchmark gebruikt?

2. Hoe moeten de datakwaliteit issues en kosten van de benchmark zélf behandeld worden

3. Gevolgen van data wachttijd (latency)?

Page 31: De Waarde van Data - Frank Harland (Sogeti)

31

Application

Frank,

I have a few companies in Finance, Telecom and Insurance where the methodology has been used in practice.

In my role at IBM SWG, as the Director of Master Data Governance, it is my responsibility to define and implement good data governance practices and software products. Quantitative master data governance is one of the primary focuses on IBM in the nextwave of MDM. The coming releases of MDM software will be increasingly heavy on metrics. The metrics under consideration are part of it.

In fact we are demoing a new IBM software asset at the IOD conference this week. The asset/product is called Master Data Policy Hub and it is all about quantitatively defined policies and their monitoring. The metrics I discussed in the blog are not there yet but they are coming next.

Unfortunately I won't be in London but it is certainly a great idea to meet some time soon. Are you planning any trips to the East Coast of the US?

Cheers,

Larry

Lawrence Dubov, Ph.D.Product Director, Master Data GovernanceIBM Software Group, Information Management

Finance, Telecom and Insurance used in practice

Quantitative master data governance is one of the primary focuses

new IBM software asset

The metrics … are coming next

Master Data Policy Hub

Page 32: De Waarde van Data - Frank Harland (Sogeti)

32

MIKE 2.0

• Robert Hillard en Sean McClowry− Method for an Integrated Knowledge Environment (MIKE)

− Open source delivery framework for Enterprise Information Management.

− http://mike2.openmethodology.org

Page 33: De Waarde van Data - Frank Harland (Sogeti)

33

Methode MIKE 2.0

• Druk de economische waarde van ondernemingsinformatie uit in een percentage van de marktwaarde− Waarde onderneming (Vorg) gebaseerd op Aandeelprijs x aantal

aandelen

− IC: Informatie coëfficient branche gebaseerd op marktonderzoek

− Informatiewaarde(VI) is Marktwaarde * IC:

◦ VI (theoretical) = VOrg x IC

− Informatie Quickscan (IMQS) gebruikt om huidige en toekomstige informatie efficiency te bepalen (IE)

◦ IEcurrent = IMQS current / IMQS Benchmark

◦ IEfuture = IMQS future / IMQS Benchmark

Page 34: De Waarde van Data - Frank Harland (Sogeti)

34

Methode MIKE 2.0

• Potentiële waardevermeerdering is te berekenen met:◦ VI (estimated) current = VI (theoretical) x IEcurrent

◦ VI (estimated) future = VI (theoretical) x IEfuture

◦ VI (estimated) Gains = VI (estimated) future - VI (estimated) current

VI = informatiewaarde IE = informatie efficiency

• MIKE 2.0 heeft hiermee berekend dat:

− Bij banken en verzekerings maatschappijen 70-80% van waarde van organisatie in informatie zit.

− Bijvoorbeeld fabricage bedrijven is dat 30-40%

− Telecom & grote retailers: 50-60%

Page 35: De Waarde van Data - Frank Harland (Sogeti)

35

Invuloefening

• IT bedrijf Vorg = 500M− Informatie Coefficient (IC) = 20%

− Theoretische waarde informatie = VI (Theoretical) = 500M x 20% = 100 M

− Uit Quickscan komt overall waarde van 0,7 op een schaal van 0-5

− Branche gemiddelde is 1,8

− Informatie Efficiency: IECurrent = 0,7 / 1,8 = 0,389

− Willen naar IE Future: IE Future = 2.5 / 1.8 = 1.389

− VI(Estimated) Huidig: 100 M x 0,389 = 38,9 M

− VI(Estimated) Toekomstig: 100 M x 1,389 = 138, 9 M

− Verschil: 100 Miljoen

Page 36: De Waarde van Data - Frank Harland (Sogeti)

36

Why again?

Page 37: De Waarde van Data - Frank Harland (Sogeti)

37

Data en informatie als een bedrijfsactief?

Hoeveel mensen in het publiek vinden dat

• Data moet worden behandeld als een bedrijfsactief, net als andere activa?

Page 38: De Waarde van Data - Frank Harland (Sogeti)

38