Ngi data science

21
Linda Terlouw ([email protected]) Tutorial Data Science

Transcript of Ngi data science

Page 1: Ngi data science

Linda Terlouw ([email protected])

Tutorial Data Science

Page 2: Ngi data science

Data Science is een vakgebied dat zich richt op het verzamelen, organiseren en analyseren van (grote) data sets om patronen te ontdekken.

Hadden we niet al BI?

Page 3: Ngi data science

Data Science is niet nieuw. De populariteit ervan neemt wel toe door ontwikkelingen die de opslag en verwerking van grote datasets gemak-kelijker maken (Big Data). Hieronder vallen bijv. NoSQL data stores en in-memory databases.

Page 4: Ngi data science

De data scientist bestaat niet. Mensen werkzaam in data science hebben verschillende achtergronden.

Data Analytics combineert technieken uit o.a. de volgende vakgebieden: Statistiek, Opera-

tional research en Software engineering.

Page 5: Ngi data science

Google introduceerde PageRank; een algoritme dat keek naar “het belang” van webpagina’s.

Search engines als AltaVista gebruikten traditionele information retrieval-technieken.

Page 6: Ngi data science

Kaggle heeft een wedstrijd uitgezet om met behulp van data science meer “te zien” dan artsen voor het voor-

komen en genezen van oogafwijkingen bij diabetici.

Page 7: Ngi data science

Met behulp van data science kun je weten dat de klant ver-trekt voordat hij het zelf weet.

privacy?

Page 8: Ngi data science

Tom M. Mitchell: “A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E”.

Machine Learning?

Page 9: Ngi data science

Overfitting versus

underfitting

Page 10: Ngi data science

Enkele aanpakken in data science zijn:- classificatie- regressie- clustering- similarity matching- association rule discovery- graafanalyse

Dit is geen complete lijst!

Page 11: Ngi data science

Classificatie voorspelt een niet-numerieke waarde

Voorbeeldhet onderscheiden van normale en frauduleuze transacties voor het automatisch blokkeren van

credit cards

Page 12: Ngi data science

Regressievoorspelt een numerieke waarde

Voorbeeldhet voorspellen van het aantal flesjes bier dat verkocht wordt

aan de hand van prijs en het weer

Page 13: Ngi data science

Clusteringontdekt groepen van gelijksoortige dingen

Voorbeeldhet segmenteren van klant-groepen met verschillende

behoeftes

Page 14: Ngi data science

SIMILARITY MATCHINGvoorspelt gelijksoortige producten

Voorbeeldhet voorspellen van een Net-flix-serie op basis van eerder

kijkgedrag

Page 15: Ngi data science

Association rule discoverybepaalt gelijkheid van dingen op basis van transacties

Voorbeeldhet bieden van gepersonaliseerde aan-

biedingen op basis van producten die al in de kar liggen

Page 16: Ngi data science

Graafanalyseanalyseert netwerken van mensen of dingen

Voorbeeldhet vinden van fraudenetwerken

in de zorgsector

Page 17: Ngi data science

In Nederland is het nieuwe vakgebied Process Mining ontwikkeld.

Dit is Data Science toegepast op bedrijfsprocessen.

Page 18: Ngi data science

Business Understanding

Data Understanding

Data Preparation

Modeling

Evaluation

Deployment

Het data science-proces is geen rechte lijn van A naar B.

Page 19: Ngi data science

Demo

Page 20: Ngi data science

Process mining as a Service: www.processminingfactory.com

[email protected]

icrismeasure facts, treasure knowledge

Page 21: Ngi data science
linda
Stamp