Data en Voetbal - nuwiskundecongres.nl lezing Tijs Rokers.pdf · ADO Den Haag 64% L Ajax 39% L PEC...

Post on 01-Sep-2019

3 views 0 download

Transcript of Data en Voetbal - nuwiskundecongres.nl lezing Tijs Rokers.pdf · ADO Den Haag 64% L Ajax 39% L PEC...

Data en Voetbal(G)een logische combinatie?

Wie ben ik?

• Afgestudeerd Econometrist (Erasmus Rotterdam - 2002)

• Nu: Data Scientist / Analytical Storyteller

• Ik help bedrijven met:

– Data -> Informatie -> Intelligence

– Betere beslissingen (of minder slechte?)

• Kan dit ook in het voetbal?

Wie ben ik? - 2

• Analist 1e team bij:

– AZ

– Heracles

– FC Twente

• Vaste analist NOS Langs de Lijn

De marges in top-sport zijn klein

100m sprint Olympics London

100m sprint Olympics London

Kans dat de favoriet ook wint:

Source: The numbers game, Sally and Anderson

Baseball

NFL

NBA

Handball

Soccer

Trend en ruis

Trend en ruis

De Nederlandse school ….?

Nederlandse school - deel 2

Feyenoord tijdens 7 opeenvolgende verlieswedstrijden

Tegenstander Balbezit Uitslag

NEC 52% L

PSV 61% L

AZ 59% L

Heerenveen 60% L

ADO Den Haag 64% L

Ajax 39% L

PEC Zwolle 56% L

Roda JC 61% G

FC Utrecht 48% W

Voorbeeld uit de praktijk

• Heracles – Heerenveen

• 1-1 bij rust

• Heerenveen blijkt in de eerste 15 minuten na rust:

– De grootste kans op tegendoelpunten te hebben (conversie)

– De meeste kansen tegen te krijgen (aantal schoten)

• Dus, wat ga je doen?

Penalty Kicks

Penalty Kicks

Uitstapje:WK 2014

Welke analyses had van Gaal?

• D#

• 1 : 4

Tegendoelpunten Spanje (pre-WK)

Een alternatieve kijk - 1

Expected goals

• Beoordelingsmodel ‘kansen’

• Variabelen:

– Location (dichterbij is beter)

– Soort poging (voeten > hoofd)

– Waar begon balbezit? (omschakeling vs opbouw)

– Hulp gekregen? (steekpass > assist > geen assist)

– Aantal balaanrakingen (hoe meer hoe beter)

– En meer…

Manchester City - Feyenoord

Voorbeelden uit de praktijk

Voorbeelden uit de praktijk

Een alternatieve kijk - 2

Bron:

Lotte Bransen

Sci-Sports

Wat is het probleem?

• Meeste aanpakken focussen op:– Assists en keypasses– Passnauwkeurigheid (%)

• Assists en keypasses zijn zeldzaam -> informatie gaat verloren

• Passnauwkeurigheid -> ‘makkelijke’ en ‘moeilijke’ passes hetzelfde gewaardeerd

• Oplossing: een waarde geven aan alle passes

Databeschrijving

• Ball event data

• 5 seizoenen (2012-2017) top 5 competities

• 8.6 miljoen passes

• Waarvan 6.6 miljoen aangekomen

Pass-oriented pass value (PPV)

• Stap 1: Vind de 100 naaste buren (passes)

• Stap 2: Vind hun possession sequence uitkomst (doelpoging of niet)

• Stap 3: PPV = gemiddelde possession sequence uitkomst van de 100 naaste buren

Pass-oriented pass value (PPV)

Resultaten – 2016/2017 PPV methode

PPV = 0.305

PPV = 0.0444

Resultaten – 2016/2017 PPV methode

Top 10 spelers onder 22:

1. Alex Iwobi

2. Maxime Lopez

3. Kingsley Coman

4. Thomas Lemar

5. Ousmane Dembélé

6. Marco Asensio

7. Renato Sanches

8. Leroy Sané

9. Julian Brandt

10.Harry Winks