ANWB Data Gedreven

20
ANWB data gedreven: Voorspellen van autopech Gregor Abbas, Tijmen Blankevoort, Remko Stam

Transcript of ANWB Data Gedreven

Page 1: ANWB Data Gedreven

ANWB data gedreven: Voorspellen van autopech

Gregor Abbas, Tijmen Blankevoort, Remko Stam

Page 2: ANWB Data Gedreven

Gregor Abbas, Tijmen Blankevoort, Remko Stam

2

Hoe kunnen we big data technologie inzetten?

Page 3: ANWB Data Gedreven

Gregor Abbas, Tijmen Blankevoort, Remko Stam

3

Forecasting Wegenwacht

Page 4: ANWB Data Gedreven

Gregor Abbas, Tijmen Blankevoort, Remko Stam

Forecasting Wegenwacht: Wie krijgt waar wanneer waarmee pech?• ± 1.100.000 pechmeldingen per jaar• 750 wegenwachten

• Overcapaciteit = duur• Ondercapaciteit = slecht product

Datum Dag Aantal gestrande auto's - TOP 10

2012-02-07 Dinsdag 9.8902012-02-02 Donderdag 9.3522012-02-06 Maandag 9.2712012-02-01 Woensdag 8.3322010-12-02 Donderdag 7.8182010-12-01 Woensdag 7.5102010-01-04 Maandag 7.4752012-02-03 Vrijdag 7.2442010-12-20 Maandag 6.9652010-12-03 Vrijdag 6.846

Page 5: ANWB Data Gedreven

Gregor Abbas, Tijmen Blankevoort, Remko Stam

5Forecasting Wegenwacht: Wie krijgt waar wanneer waarmee pech?

Ultieme uitdaging: Voorspellen dat dhr. Jansen morgen om 9:24 met zijn VW polo strandt met een lekke band (rechtsvoor) op de Kerkdijk 59.

Economische ontwikkeling

Temperatuur

Neerslag

Technologische ontwikkeling

Consumenten gedrag

Consumenten

behoeften

Global warming

Page 6: ANWB Data Gedreven

De case: forecast pechgevallen

Regio’s Nederland (totaal 4)

Per half uur:

HoofdvraagKunnen we de hoeveelheid pechgevallen voorspellen op basis van historische data?

Per dag:

Page 7: ANWB Data Gedreven

Analyse op werkgebied-niveau

Werkgebieden Nederland (totaal 33)

Weerstation

Per half uur:

Per dag:

Page 8: ANWB Data Gedreven

Gebruikte data

Scyfer Deep Learning

Weerslag

Historische gegevens KNMIPredicties Weerslag

PechgevallenLedenaantallen

FeestdagenSchoolvakantiesDag/Maand/Jaar

Page 9: ANWB Data Gedreven

Deep Learning

Superhuman image recognition (Microsoft 2015)

Self-Driving Car (Google)

Deep Learning - more complex concepts in subsequent layers

Deep learning is currently winning all machine learning challenges

Page 10: ANWB Data Gedreven

Voorspellingen - Werkgebied

Page 11: ANWB Data Gedreven

Voorspellingen - Regio

Page 12: ANWB Data Gedreven

Voorspellingen per dag heel 2014

Page 13: ANWB Data Gedreven

De resultaten

ANWB Scyfer Verbetering

Noord-Oost 44 38 14%

Noord-West 55 44 20%

Zuid 55 45 18%

Zuid-West 46 38 17%

Nederland 164 123 25%

Gemiddelde absolute fout per dag op 2014

Vergelijking Scyfer modellen en ANWB personeel voorspellingen (m.b.v. ander model en eigen inzicht)

De verbetering is t.o.v. het aantal fouten per dag.Totaal gemm. 7% foute voorspellingen per dag.

- Trainset: data 2004-2012- Validatieset: data 2013

- Hertraining data 2004-2013- Test: Forecast 2014

Page 14: ANWB Data Gedreven

Sneller voorspellen

Voorheen meerdere uren per dag kwijt met maken voorspellingen

Nu:Software die met één druk op de knop de forecast maakt:

○ Downloaden weergegevens

○ Genereren input voor model

○ Voorspelling (incl. grafieken/tabellen)

Page 15: ANWB Data Gedreven

In de praktijk?

Voorspellingen pechgevallen van 7% in 2014 naar 4.5% fout in deze maandMaar: Geen significant verschil tussen ANWB personeel en Scyfer model.

Vervolgstap: Zoek uit waarom dit zo is!

Page 16: ANWB Data Gedreven

Conclusie

Alternatieve vervolgstap:Voorspelling locatie?

Eindresultaat:● Theoretisch verbeterd pechgevallen model m.b.v. Big Data● Snellere voorspellingen maken, geen Excel● Vervolgonderzoek: Waarom in de praktijk hetzelfde

resultaat?

Page 17: ANWB Data Gedreven

Gregor Abbas, Tijmen Blankevoort, Remko Stam

17

Computer says ‘no’

Page 18: ANWB Data Gedreven

Gregor Abbas, Tijmen Blankevoort, Remko Stam

18

Van Passief naar Preventief

? !

Passief Proactief Preventief

Voorspellen dat dhr. Jansen morgen om 9:24 met zijn VW polo strandt met een lekke band (rechtsvoor) op de Kerkdijk 59.

Page 19: ANWB Data Gedreven

Gregor Abbas, Tijmen Blankevoort, Remko Stam

19

Page 20: ANWB Data Gedreven

Gregor Abbas, Tijmen Blankevoort, Remko Stam

20

Gregor Abbas@kreekoor

[email protected]

Tijmen [email protected]