DDMA / PWC: Dag v/d Datakwaliteit 2008

17
Slide 1 Hoe slimme data analyse de veiligheid in Nederland verbetert PricewaterhouseCoopers oktober 2008 Event: DDMA DQ Dag Thema: Dataquality Spreker: Hans Henseler – Forensic Technology Solutions, PwC Advisory Datum: 7 oktober 2008, Muziekgebouw aan het IJ www.ddma.nl

description

“Datamining’, ‘textmining’, patronen, terrorismebestrijding en fraude. Nee, we spelen niet mee in de Nederlandse CSI, maar het lijkt bijna het geval tijdens de keynote op DDMA’s Dag van de Datakwaliteit. Hans Henseler, data analyse expert van PWC en adviseur voor het Nederlands Forensisch Instituut (NFI) zet uiteen hoe via een slimme analyse van data, verbanden aan het licht worden gebracht die helpen bij het bestrijden van criminaliteit. Patroonherkenning Computers zijn bij uitstek geschikt om rangschikkingen in ongestructureerde data te maken. Henseler is betrokken geweest bij de opzet van Kecida, een kennis- en expertisecentrum voor intelligente data-analyse. Een project gefinancierd door de Nationaal Coördinator Terrorismebestrijding (NCTB). Kecida bekijkt of er patronen te vinden zijn in informatie verkregen via de Immigratie en Naturalisatiedienst (IND) en de politie (KLPD). En vervolgens worden deze patronen door de software eenvoudig gevisualiseerd. De ‘patronen’ kunnen heel verschillende data omvatten: van teksten tot financiële transacties, van sociale netwerken tot telefoongegevens. Terrorisme De data van de aanslagen van 9/11 zijn ook geanalyseerd. De onderlinge relaties tussen de onderwerpen die door de computer zijn gedestilleerd worden bovendien in één oogopslag grafisch weergegeven. In de V.S. maakt men bij terrorismebestrijding momenteel veel gebruik van tekstmining van nieuwsberichten. Bij grote collecties tekstbestanden kan de software bijvoorbeeld autonome namen en plaatsen filteren. Vervolgens legt men relaties tussen deze woorden. Witwaspraktijken Ook geldstromen kunnen in kaart worden gebracht. Dit gebeurt door een rangschikking van transacties naar bankrekeningnummer. De visuele weergave heeft nog het meeste weg van een gebroken spinnenweb. Bij de analyse van deze data, bijvoorbeeld door de politie wordt gelet op grote groepen van rekeningen waarbij de geldstromen onevenredig zijn verdeeld. De transacties helpen ook personen identificeren. Zo kan het bijvoorbeeld dat iemand zijn rekeningnummer heeft opgezegd, maar door zijn transactiepatroon weer achterhaald kan worden. Dit principe geldt ook voor telefoonnummers. Het belang van datakwaliteit Bij slimme data-analyse is datakwaliteit onontbeerlijk. Met slechte data is slimme analyse vrijwel onmogelijk. Met gebrekkige datakwaliteit kunnen verbanden verloren gaan doordat namen bijvoorbeeld niet matchen. Hetgeen weer kan leiden tot veel complexere patronen. Daarnaast is er nog een wetmatigheid die geldt voor zowel de marketing als het toezicht op de nationale veiligheid: het zijn uiteindelijk de mensen die de data juist interpreteren en inzetten.

Transcript of DDMA / PWC: Dag v/d Datakwaliteit 2008

Page 1: DDMA / PWC: Dag v/d Datakwaliteit 2008

Slide 1Hoe slimme data analyse de veiligheid in Nederland verbetertPricewaterhouseCoopers

oktober 2008

Event: DDMA DQ Dag

Thema: Dataquality

Spreker: Hans Henseler – Forensic Technology Solutions, PwC Advisory

Datum: 7 oktober 2008, Muziekgebouw aan het IJ

www.ddma.nl

Page 2: DDMA / PWC: Dag v/d Datakwaliteit 2008

PwC

Hoe slimme data analyse onze veiligheid in Nederland verbetert7 oktober 2008

Dag van de datakwaliteit, Muziekgebouw aan het IJ, AmsterdamDr.ir. Hans Henseler, Forensic Technology Solutions, PwC Advisory

Page 3: DDMA / PWC: Dag v/d Datakwaliteit 2008

Slide 3Hoe slimme data analyse de veiligheid in Nederland verbetertPricewaterhouseCoopers

oktober 2008

Door middel van slimme analyses effectiever openbare orde en veiligheid handhaven

Ziet u het patroon ?

Dag van de datakwaliteit

Page 4: DDMA / PWC: Dag v/d Datakwaliteit 2008

Slide 4Hoe slimme data analyse de veiligheid in Nederland verbetertPricewaterhouseCoopers

oktober 2008

Bronnen

Marechaussee

INDKLPd

Politie

AdviezenOnderzoek

Methoden en technieken

Statistiek Datamining PatroonherkenningSociale netwerk

analyse

Dag van de datakwaliteit

Page 5: DDMA / PWC: Dag v/d Datakwaliteit 2008

Slide 5Hoe slimme data analyse de veiligheid in Nederland verbetertPricewaterhouseCoopers

oktober 2008

Kecida is onderdeel van het project Patroonherkenningdat gefinancierd wordt door de NCTb

Dag van de datakwaliteit

Patroonherkenning

VIA: Veiligheid door Information Awareness

Page 6: DDMA / PWC: Dag v/d Datakwaliteit 2008

Slide 6Hoe slimme data analyse de veiligheid in Nederland verbetertPricewaterhouseCoopers

oktober 2008

Een voorbeeld van informatieanalyseDe feiten op een rijtje

Dag van de datakwaliteit

Page 7: DDMA / PWC: Dag v/d Datakwaliteit 2008

Slide 7Hoe slimme data analyse de veiligheid in Nederland verbetertPricewaterhouseCoopers

oktober 2008

Voorbeeld: text mining en datakwaliteitExtractie van namen en plaatsen

Dag van de datakwaliteit

Page 8: DDMA / PWC: Dag v/d Datakwaliteit 2008

Slide 8Hoe slimme data analyse de veiligheid in Nederland verbetertPricewaterhouseCoopers

oktober 2008

Brondata: Grote collectie tekstbestanden

Mickey Mouse werkt voor Donald Duck Dit bericht is online sinds 02/10/2007Mickey Mouse blijkt al sinds 2000 te werken voor Donald Duck. Hij zorgde er onder andere voor dat Donald Duck zonder moeite zijn neefjes mee kon nemen naar Disneyland.

Donald Duck aangehouden in Den HaagDit bericht is online sinds 29/09/2007Gisteren hebben Balkenende en Madonna toestemming gegeven om de beruchte Donald Duck aan te houden in Den Haag vlak voor zijn optreden als eend.

Dag van de datakwaliteit

Page 9: DDMA / PWC: Dag v/d Datakwaliteit 2008

Slide 9Hoe slimme data analyse de veiligheid in Nederland verbetertPricewaterhouseCoopers

oktober 2008

Weergave van het sociale netwerk

Donald Duck

Madonna

Balkenende

Mickey Mouse

Den Haag

Disney Land

Dag van de datakwaliteit

Page 10: DDMA / PWC: Dag v/d Datakwaliteit 2008

Slide 10Hoe slimme data analyse de veiligheid in Nederland verbetertPricewaterhouseCoopers

oktober 2008

Automatische analyse van nieuwsberichten over terrorisme

Door slimme analyse van open bronnen kan snel inzicht verkregen worden in nieuwe ontwikkelingen

Dag van de datakwaliteit

Page 11: DDMA / PWC: Dag v/d Datakwaliteit 2008

Slide 11Hoe slimme data analyse de veiligheid in Nederland verbetertPricewaterhouseCoopers

oktober 2008

Text mining: het structureren van ongestructeerde gegevensen zonodig koppelen aan andere gegevens

Dag van de datakwaliteit

Page 12: DDMA / PWC: Dag v/d Datakwaliteit 2008

Slide 12Hoe slimme data analyse de veiligheid in Nederland verbetertPricewaterhouseCoopers

oktober 2008

Visualisatie en datacleaning

Dag van de datakwaliteit

Page 13: DDMA / PWC: Dag v/d Datakwaliteit 2008

Slide 13Hoe slimme data analyse de veiligheid in Nederland verbetertPricewaterhouseCoopers

oktober 2008

Voorbeeld: Onderzoeken van geldstromenSlim zoeken naar witwaspatronen

Ieder rood punt stelt een bankrekening voor:

Dag van de datakwaliteit

Page 14: DDMA / PWC: Dag v/d Datakwaliteit 2008

Slide 14Hoe slimme data analyse de veiligheid in Nederland verbetertPricewaterhouseCoopers

oktober 2008

Groepen van twee rekeningen zijn minder interessantGrotere groepen vallen op

Dag van de datakwaliteit

Page 15: DDMA / PWC: Dag v/d Datakwaliteit 2008

Slide 15Hoe slimme data analyse de veiligheid in Nederland verbetertPricewaterhouseCoopers

oktober 2008

Een generieke benadering: CRISP-DMCross Industry Standard Process for Data Mining

Dag van de datakwaliteit

Page 16: DDMA / PWC: Dag v/d Datakwaliteit 2008

Slide 16Hoe slimme data analyse de veiligheid in Nederland verbetertPricewaterhouseCoopers

oktober 2008

Conclusies

Door data slimmer te analyseren, wordt het mogelijk om:• Nieuwe verbanden te ontdekken zodat risico’s sneller herkend worden.• Patronen te visualiseren en dus meer informatie te verwerken.• Met dezelfde mensen meer resultaat te behalen.• Door toepassing in het domein van openbare orde en veiligheid (OOV) de

veiligiheid in Nederland te verbeteren.

Een voorwaarde voor slimme analyse is een goede kwaliteit van de data! • Als namen niet matchen gaan verbanden verloren.• Als namen vaker voorkomen dan leidt dat tot veel complexere patronen.• Met slechte data wordt de analyse van informatie een stuk moeilijker.

Dag van de datakwaliteit

Page 17: DDMA / PWC: Dag v/d Datakwaliteit 2008

© 2008 PricewaterhouseCoopers. All rights reserved. “PricewaterhouseCoopers” refers to the network of member firms of PricewaterhouseCoopers International Limited, each of which is a separate and independent legal entity. *connectedthinking is a trademark of PricewaterhouseCoopers LLP (US).

PwC

Bedankt voor uw aandacht!