ANWB Data Gedreven

Post on 21-Jan-2017

600 views 0 download

Transcript of ANWB Data Gedreven

ANWB data gedreven: Voorspellen van autopech

Gregor Abbas, Tijmen Blankevoort, Remko Stam

Gregor Abbas, Tijmen Blankevoort, Remko Stam

2

Hoe kunnen we big data technologie inzetten?

Gregor Abbas, Tijmen Blankevoort, Remko Stam

3

Forecasting Wegenwacht

Gregor Abbas, Tijmen Blankevoort, Remko Stam

Forecasting Wegenwacht: Wie krijgt waar wanneer waarmee pech?• ± 1.100.000 pechmeldingen per jaar• 750 wegenwachten

• Overcapaciteit = duur• Ondercapaciteit = slecht product

Datum Dag Aantal gestrande auto's - TOP 10

2012-02-07 Dinsdag 9.8902012-02-02 Donderdag 9.3522012-02-06 Maandag 9.2712012-02-01 Woensdag 8.3322010-12-02 Donderdag 7.8182010-12-01 Woensdag 7.5102010-01-04 Maandag 7.4752012-02-03 Vrijdag 7.2442010-12-20 Maandag 6.9652010-12-03 Vrijdag 6.846

Gregor Abbas, Tijmen Blankevoort, Remko Stam

5Forecasting Wegenwacht: Wie krijgt waar wanneer waarmee pech?

Ultieme uitdaging: Voorspellen dat dhr. Jansen morgen om 9:24 met zijn VW polo strandt met een lekke band (rechtsvoor) op de Kerkdijk 59.

Economische ontwikkeling

Temperatuur

Neerslag

Technologische ontwikkeling

Consumenten gedrag

Consumenten

behoeften

Global warming

De case: forecast pechgevallen

Regio’s Nederland (totaal 4)

Per half uur:

HoofdvraagKunnen we de hoeveelheid pechgevallen voorspellen op basis van historische data?

Per dag:

Analyse op werkgebied-niveau

Werkgebieden Nederland (totaal 33)

Weerstation

Per half uur:

Per dag:

Gebruikte data

Scyfer Deep Learning

Weerslag

Historische gegevens KNMIPredicties Weerslag

PechgevallenLedenaantallen

FeestdagenSchoolvakantiesDag/Maand/Jaar

Deep Learning

Superhuman image recognition (Microsoft 2015)

Self-Driving Car (Google)

Deep Learning - more complex concepts in subsequent layers

Deep learning is currently winning all machine learning challenges

Voorspellingen - Werkgebied

Voorspellingen - Regio

Voorspellingen per dag heel 2014

De resultaten

ANWB Scyfer Verbetering

Noord-Oost 44 38 14%

Noord-West 55 44 20%

Zuid 55 45 18%

Zuid-West 46 38 17%

Nederland 164 123 25%

Gemiddelde absolute fout per dag op 2014

Vergelijking Scyfer modellen en ANWB personeel voorspellingen (m.b.v. ander model en eigen inzicht)

De verbetering is t.o.v. het aantal fouten per dag.Totaal gemm. 7% foute voorspellingen per dag.

- Trainset: data 2004-2012- Validatieset: data 2013

- Hertraining data 2004-2013- Test: Forecast 2014

Sneller voorspellen

Voorheen meerdere uren per dag kwijt met maken voorspellingen

Nu:Software die met één druk op de knop de forecast maakt:

○ Downloaden weergegevens

○ Genereren input voor model

○ Voorspelling (incl. grafieken/tabellen)

In de praktijk?

Voorspellingen pechgevallen van 7% in 2014 naar 4.5% fout in deze maandMaar: Geen significant verschil tussen ANWB personeel en Scyfer model.

Vervolgstap: Zoek uit waarom dit zo is!

Conclusie

Alternatieve vervolgstap:Voorspelling locatie?

Eindresultaat:● Theoretisch verbeterd pechgevallen model m.b.v. Big Data● Snellere voorspellingen maken, geen Excel● Vervolgonderzoek: Waarom in de praktijk hetzelfde

resultaat?

Gregor Abbas, Tijmen Blankevoort, Remko Stam

17

Computer says ‘no’

Gregor Abbas, Tijmen Blankevoort, Remko Stam

18

Van Passief naar Preventief

? !

Passief Proactief Preventief

Voorspellen dat dhr. Jansen morgen om 9:24 met zijn VW polo strandt met een lekke band (rechtsvoor) op de Kerkdijk 59.

Gregor Abbas, Tijmen Blankevoort, Remko Stam

19

Gregor Abbas, Tijmen Blankevoort, Remko Stam

20

Gregor Abbas@kreekoor

gabbas@anwb.nl

Tijmen Blankevoorttijmen@scyfer.nl