Bi symposium

42
I T C G Harald Kikkers [email protected] I T C G IT Consultancy Group bv Friesestraatweg 215 9743 AD Groningen …maar mág het ook?

Transcript of Bi symposium

Harald [email protected]

I T C G

IT Consultancy Group bv

Friesestraatweg 2159743 AD Groningen

…maar mág het ook?

I T C G…maar mág het ook?

2

Harald Kikkers

ITCG | DATPROF

I T C GOvereenkomst tussen…

3

ig Data

usiness Intelligence ?&

I T C GDe letter…

4

I T C GEn zou je een “B” film maken…

5

Bron: http://www.pastemagazine.com/.../the-100-best-b-movies-of-all-time.html

39. Shark Attack 3: Megalodon(2002 / David Worth)

32. The Incredible Shrinking Man (1967 / Jack Arnold)

18. Braindead(1992 / Peter Jackson)

I T C GBusiness case voor B-films?

• Vele liefhebbers• ‘Bewezen technieken’, voldoende matige acteurs• Goedkoop• Positieve business case

– Duidelijk doel– Lage kosten– Goed haalbaar

6

I T C GBig data & BI projecten

Onduidelijkheid? “NEE!”

versie-nummer 7

usiness case?

Doel HaalbaarheidVoordelen Kosten

I T C GPeter Jackson…

8

Braindead (1992), maar ook…

I T C GThe Lord of the Rings

Doel• A-film / blockbuster

Haalbaarheid• Techniek garandeert succes?

Business case?

9

I T C GSuggestie / werkelijkheid?

10

Kunst-project BI-project

I T C GBetrouwbaarheid informatie!

11

Business CaseDoel

Betrouwbaarheid

Informatie

Kosten Haalbaarheid

I T C GBetrouwbaarheid

12

I T C GBig Data = uitdaging!

13

I T C GLOFAR

14

I T C GLOFAR – data & proces

15

Glasvezel verbindingen

Duizenden antennes

A/D-converters Super computer

Wetenschappelijke analyse

I T C GUniversitair medisch centrum

16

Zorg, onderzoek & onderwijs

Systemen Foto’s, tekst en tabellen

Clinical Data Repository

I T C GProblemen oneerlijk verdeeld?

• Gelukkig niet

• Ook ‘Small Data’ projecten bieden geweldige faal-kansen!

• Data-problemen• Proces-problemen

17

FacebookGoogle

amazon.com

I T C GInformatie-snoepwinkel…

18

I T C GWie ben ik? Wat wil ik?

19

Vernieuwer?

Volger?

I T C GChocola van te maken…?

20

Bron

Blok D.

Piet Z.Klaas S.

D. Blok

VMMF

Man G.H. M

Naam Geslacht OrderbedragValutaEUREURDKKEUREUR

25100250

5075

Aantal klanten?(zelfde naam en geslacht)

Gemiddelde besteding?

100

125

167

57 71 955 4 3

I T C GProces-problemen

21

I T C GOnderken én elimineer bedreigingen!

• Vele (vaak ogenschijnlijk klein)• Kunnen jouw dag verpesten!

22

I T C GKunnen wij het maken?

• Juiste architectuur kiezen• Data- en proces-problemen onderkennen én

oplossen• Binnen beperkte tijd• Tegen beperkte kosten

23

I T C G

Kenmerken bronnen

• Aantal bronnen?• Mate van overlap?• Complexiteit meta-

data?• Hoeveelheid data?• Mutatiegraad en

aanwas?• Kwaliteit data?

Kenmerken gebruiksdoel

• Vaste of variabele vraag?

• Continue of periodieke opvraging?

• Aggregatie of details?• Indicatief of exact?• Historisch of actueel?

24

Architectuur

I T C GArchitectuur: Historie…?

25

Ja hoor, we ondersteunen

historie!

…van meta data?…van transformatieregels?

…van brondata?…van afgeleide gegevens?

…van mutaties op brondata?…van mutaties op afgeleide gegevens?

…?

I T C G

HSE

Veel bronnen?

• Sturen op genericiteit koppelvlakken– Afspraken (GLO’s)– Ontkoppeling– Techniek

26

E S HE S H

I T C G

HLE

Complexe meta-data?

27

E L HE L H MMM

Meta Data

TTT

OOO

QQQ

Software generatie Productiviteit!

Betrouwbaarheid!

I T C GDoel en middel

28

I T C GOptimaliseren maak-proces

• Meteen focus op data kwalitiet (geen GI-GO!)• AGILE methode (iteratief!)

• Big vertraging door testen met Big Data?

29

AGILE bouw

Big Data test

I T C GSmall Data test

30

AGILE bouw

‘Small Data’ test

AGILE bouw

Big Data test

I T C GTesten met subsets

31

S

I T C GKunnen wij het maken?

32

“JA!!!”

AGILE

Tooling

Snelheid

Performance

Betrouwbaarheid“Alles in place”

Productiviteit

Efficiency

Binnen budget

Duidelijke doelstelling

Op planning

Architectuur

I T C G…maar mág het ook?

33

Eigen organisatie

Publiek Wet- en regelgeving

Gevoelige data?

I T C GEigen organisatie

34

I T C GPubliek

35

I T C GWet- en regelgeving

36

I T C GBusiness case – Kosten gevoelige data

37

Risico’s• Imago-schade• Reputatie-schade• Geldboetes

Maatregelen• Beveiliging• Screening• Subsetting• Anonimisering• …

I T C GGeanonimiseerd testen

38

S

S

A

I T C GAnonimisering

39

‘Blank’ ‘Blur’ ‘Shuffle’‘Subset’

I T C GGeanonimiseerde analyse

40

A

I T C GSamenvatting

41

Business case? Kunnen wij het maken? …maar mág het ook?

I T C GNapraten…

42

EL

H

T

O

QS

A

M