De Waarde van Data - Frank Harland (Sogeti)

Post on 25-May-2015

661 views 1 download

Transcript of De Waarde van Data - Frank Harland (Sogeti)

1

De Waarde van Data

Frank Harland, Consultant Business Intelligence, Sogeti Nederland

Hoe kan waarde toegekend worden aan data- en

Informatie bezittingen. Of moeten we stoppen

met een geldwaarde aan data te hangen.

2

Wat neemt u mee

Wat neemt u mee van deze sessie:

• Waarom zou u wel of geen effort moeten steken in waarderen van uw data bezit.

• Welke methoden kunnen worden gebruikt om de waarde van data en informatie inzichtelijk te maken

3

Agenda

• Wat− Wat versta ik onder data & informatie

− Termen

− Onderzoek

− Zijn data en informatie Activa?

• Waarom

− Waarderen van Data en Informatie

• Hoe

− Waarderings methodes

3

4

Data

• Latijn voor “een gegeven” of “een feit”.

5

Data – Informatie – Kennis - Wijsheid

Toegevoegd: Mensen en actie

Toegevoegd: Mensen en betekenis

Toegepaste kennis

Toegevoegd metadata: Definitie & Presentatie

Begrepen en toegepaste informatie

Heeft toegevoegde waarde wanneer

eenvoudig verkrijgbaar

Data in context. Vb. Telefoonnummer Rest.

Artistos in Lagos is00 351 282 760 659

Kennis heeft alleen waarde wanneer er op

gehandeld wordt

Representatie van Feitenover dingen bijv.

„351282760659‟

Kwaliteitsinformatiebegrepen door mensen,

kan tot waarde leiden

6

Waarde van data

22%

27%

16%

22%

13%

Kritieke bedrijfsactief,

waarde bekend

Enigszins waardevol,

vermoedde waarde

Hulpbronnen voor

applicaties, enige

intrinsieke waarde

Applicatiehulpbronnen

die altijd defect lijken te

zijn

Niet op radarscherm

Onderzoek door Initiate (IBM)

7

Onderzoek

• Analyse:− Bijna 50% zegt het is een actief

• Maar:

− Waarde is wellicht bekend: 22%

− Vermoedde waarde: 43%

− Geen veronderstelde waarde: 35%

− Waarde niet precies bekend: 78%

22%

27%

16%

22%

13%

8

Onderzoek

• Wat denkt u van de inschatting van de ondervraagden?

− Ik concludeer dat in ongeveer 80% van de organisaties de waarde van de informatie niet bekend is.

9

Waarom besteden we …

• Grote sommen aan beveiliging van gegevens die we verder onverschillig behandelen

• Belachelijke hoeveelheden tijd aan het jagen naarontbrekende gegevens

• Waarbij we

− Foute gegevens verbeteren

− “work arounds” bedenken voor incomplete gegevens

− Informatie fabriceren door het aan elkaar te plakken

− Conflicterende gegevens eenduidig proberen te maken

10

Data en informatie als een bedrijfsactief?

Hoeveel mensen in het publiek vinden dat

• Data moet worden behandeld als een bedrijfsactief, net als andere activa?

• Behandelen data binnen hun organisatie als een bedrijfsbezit, een actief?

11

Data en informatie als een bedrijfsactief?

• Moeten we data en informatie behandelen als actief?− Rob Karel, Forrester Research:

◦ No: Data has no intrinsic value. It's not worth the effort trying to assign a monetary value to data records themselves.

− John Ladley, president, IMCue Solutions

◦ No: Data has no value in and of itself. Only when being put to action or you do something with it.

− Accountants: Nee, waarom zou je? Wanneer je data op de balanszet moet je het afschrijven of behandelen als Goodwill. Denk ookaan de belasting!

12

Data en informatie als een bedrijfsactief?

• Moeilijk om de toegekende waarde die bij het record hoort te onderhouden.− Informatiegroepen als geheel bekijken?

− Hoe zit het met de processen die “op de data lopen”?

13

Data en informatie als een bedrijfactief

• Regels van AICPA:

“Genereert mogelijk toekomstig economisch voordeel".

− IMHO Data en informatie vallen in die categorie

• US-GAAP, IFRS BASEL II en Sovency II stellen hogeeisen aan data governance en betrouwbaarheid van data en informatie.

− Nemen aan dat data wordt behandeld als een bedrijfsbezit.

14

DAMA over Data and information als actief

• DAMA Chapter 1 Guide to the DMBOK: − Truly assets; they have business value, tangible or intangible

− Accounting practices consider data as intangible assets

◦ Like software, expert knowledge etc.

15

Agenda

• Wat− Wat versta ik onder data & informatie

− Termen

− Onderzoek

− Zijn data en informatie Activa?

• Waarom

− Waarderen van Data en Informatie

• Hoe

− Waarderings methodes

15

16

Waarom

• -/-− Moeilijk, nog geen tools

− “Hebben nooit zo naar data gekeken”

• + (business drivers)

− Concurrentiekracht

− Compliance

− Risk management

− “We kunnen zien dat data waarde toevoegt aan de organisatie”

17

18

Agenda

• Wat− Wat versta ik onder data & informatie

− Termen

− Onderzoek

− Zijn data en informatie Activa?

• Waarom

− Waarderen van Data en Informatie

• Hoe

− Waarderings methodes

18

19

Soorten gegevenswaarde

• Intrinsieke gegevenswaarde

• Informatieve gegevenswaarde

• Potentiële gegevenswaarde

Klant Product

LevOrg

Feit

dim dim

dimdim

Verkoop

20

Intrinsieke gegevenswaarde

• Kosten impliceren waarde (Noreen Kendle)− Huisvesting, creatie, onderhoud van data en disks kosten echt

geld.

− Waarde gerelateerd aan de inspanning nodig voor opslag, onderhoud van infrastructuur en systemen die bedrijfsgegevens bevatten

21

Informatieve gegevenswaarde

• Objecten door data beschreven− Hebben waarde of potentiële waarde

− Data heeft waarde die naar voren komtwanneer gegevens gebruikt worden

− Waarde gerelateerd aan proces dat het object ondergaat

◦ Vergelijk waarde van data item over kg. goud of kg. veren

◦ Is een data record over een grote klant meer waard dan het record over een kleine nieuwe klant?

Klant Product

LevOrg

Feit

22

Potentiële gegevenswaarde

• De waarde die kan worden gegenereerd − Analyse

− Data mining

− Big Data valt in deze categorie

• Big Data

− “Key basis of competition” (McKinsey)

− “All companies need to take Big Data seriously”

− “Estimate that a retailer using big data to the full, has the potential to increase its operating margin by more than 60 percent”

dim dim

dimdim

Verkoop

23

Methodes

• Gericht op waardetype 1− Kosten gebaseerd

− CRUD of Data (Ladley)

− Kosten van schonen en verplaatsen van gegevens

• Waardetypen 2 & 3

− Discounted Cash Flow model

− Larry Dubov, Informatie Entropie (bottom up)

− MIKE 2.0 (top down)

24

Methodes: gebaseerd op kosten

We meten:− Kosten van toelaten van dubbele records en redundantie

− Kosten van “data afval”, heruitvoer van al het werk, als gevolg van gebrekkige datakwaliteit.

− Kosten van geweigerde transacties plus heruitvoer

− Kosten van fraude

− Kosten van de tijd die nodig is om te zoeken naar informatie omdatmetadata niet goed (genoeg) is. = gem. 30% van de tijd.

− Risico maal kans, in geld uitgedrukt van gemiste kansen door slechte data

25

DAMA kosten van verlies

• Identificeer de impact van ontberen van de huidige data in de huidige kwaliteit

− Welke gevolgen (in %) voor de omzet

− Welke gevolgen (in %) voor kosten

− Welke risico‟s lopen we -> potentiële financiële impact

26

Methode Discounted Cash Flow

• Contante waardeberekening− Gebruikt voor ontwikkelen business cases en vaststellen ROI

− Voorbeeld: inschatting voordelen van MDM implementatie

− MDM impl. – 1 Miljoen plus 500K / jaar

− Kan 2 M omzet / jaar aan 25% marge = 500K opleveren

− Plus kostenbesparing van 500K en debiteuren -/- 100K /jr

− Tel alle verdiensten op en trek MDM operationele kosten af

− DCF zegt dat je de groei van niet geïnvesteerd geld moet meerekenen. Daarmee komt de huidige waarde op 1,93 M. vs 1M.

27

Dubov Informatie entropie

• Bottom up methode

• Token, attribuut, record en recordset niveau

• Complex

− Entropie = centrale meetwaarde om de hoeveelheidinformatiewaarde te bepalen

28

Larry Dubov’s vergelijkingen I

• Entropy is the central measure used in the theory to quantify the amount of information.

• The value of the enterprise party information

• Cost of one bit of useful business information

• The entropy of attribute j.

• Inform. Quality Penalty for a missing Value

• Currency equivalent of missing value

• IQ Penalty when information quality of the data element is less than 1

• Information Penalty for a record

• Aggregated information penalty for the data set

29

Larry Dubov’s vergelijkingen II

• Information Quality at any level of aggregation

• Scored Information Quality

• Estimated Information Entropy by attribute

IQIJ = Score (source value, benchmark

value)/Score (benchmark value,

benchmark value)

30

Dubov’s methode voorwaarden

Om deze theorie in praktijk te brengen moeten de volgende vragen worden beantwoord:

1. Wat wordt als benchmark gebruikt?

2. Hoe moeten de datakwaliteit issues en kosten van de benchmark zélf behandeld worden

3. Gevolgen van data wachttijd (latency)?

31

Application

Frank,

I have a few companies in Finance, Telecom and Insurance where the methodology has been used in practice.

In my role at IBM SWG, as the Director of Master Data Governance, it is my responsibility to define and implement good data governance practices and software products. Quantitative master data governance is one of the primary focuses on IBM in the nextwave of MDM. The coming releases of MDM software will be increasingly heavy on metrics. The metrics under consideration are part of it.

In fact we are demoing a new IBM software asset at the IOD conference this week. The asset/product is called Master Data Policy Hub and it is all about quantitatively defined policies and their monitoring. The metrics I discussed in the blog are not there yet but they are coming next.

Unfortunately I won't be in London but it is certainly a great idea to meet some time soon. Are you planning any trips to the East Coast of the US?

Cheers,

Larry

Lawrence Dubov, Ph.D.Product Director, Master Data GovernanceIBM Software Group, Information Management

Finance, Telecom and Insurance used in practice

Quantitative master data governance is one of the primary focuses

new IBM software asset

The metrics … are coming next

Master Data Policy Hub

32

MIKE 2.0

• Robert Hillard en Sean McClowry− Method for an Integrated Knowledge Environment (MIKE)

− Open source delivery framework for Enterprise Information Management.

− http://mike2.openmethodology.org

33

Methode MIKE 2.0

• Druk de economische waarde van ondernemingsinformatie uit in een percentage van de marktwaarde− Waarde onderneming (Vorg) gebaseerd op Aandeelprijs x aantal

aandelen

− IC: Informatie coëfficient branche gebaseerd op marktonderzoek

− Informatiewaarde(VI) is Marktwaarde * IC:

◦ VI (theoretical) = VOrg x IC

− Informatie Quickscan (IMQS) gebruikt om huidige en toekomstige informatie efficiency te bepalen (IE)

◦ IEcurrent = IMQS current / IMQS Benchmark

◦ IEfuture = IMQS future / IMQS Benchmark

34

Methode MIKE 2.0

• Potentiële waardevermeerdering is te berekenen met:◦ VI (estimated) current = VI (theoretical) x IEcurrent

◦ VI (estimated) future = VI (theoretical) x IEfuture

◦ VI (estimated) Gains = VI (estimated) future - VI (estimated) current

VI = informatiewaarde IE = informatie efficiency

• MIKE 2.0 heeft hiermee berekend dat:

− Bij banken en verzekerings maatschappijen 70-80% van waarde van organisatie in informatie zit.

− Bijvoorbeeld fabricage bedrijven is dat 30-40%

− Telecom & grote retailers: 50-60%

35

Invuloefening

• IT bedrijf Vorg = 500M− Informatie Coefficient (IC) = 20%

− Theoretische waarde informatie = VI (Theoretical) = 500M x 20% = 100 M

− Uit Quickscan komt overall waarde van 0,7 op een schaal van 0-5

− Branche gemiddelde is 1,8

− Informatie Efficiency: IECurrent = 0,7 / 1,8 = 0,389

− Willen naar IE Future: IE Future = 2.5 / 1.8 = 1.389

− VI(Estimated) Huidig: 100 M x 0,389 = 38,9 M

− VI(Estimated) Toekomstig: 100 M x 1,389 = 138, 9 M

− Verschil: 100 Miljoen

36

Why again?

37

Data en informatie als een bedrijfsactief?

Hoeveel mensen in het publiek vinden dat

• Data moet worden behandeld als een bedrijfsactief, net als andere activa?

38