Data en Voetbal - nuwiskundecongres.nl lezing Tijs Rokers.pdf · ADO Den Haag 64% L Ajax 39% L PEC...
Transcript of Data en Voetbal - nuwiskundecongres.nl lezing Tijs Rokers.pdf · ADO Den Haag 64% L Ajax 39% L PEC...
Data en Voetbal(G)een logische combinatie?
Wie ben ik?
• Afgestudeerd Econometrist (Erasmus Rotterdam - 2002)
• Nu: Data Scientist / Analytical Storyteller
• Ik help bedrijven met:
– Data -> Informatie -> Intelligence
– Betere beslissingen (of minder slechte?)
• Kan dit ook in het voetbal?
Wie ben ik? - 2
• Analist 1e team bij:
– AZ
– Heracles
– FC Twente
• Vaste analist NOS Langs de Lijn
De marges in top-sport zijn klein
100m sprint Olympics London
100m sprint Olympics London
Kans dat de favoriet ook wint:
Source: The numbers game, Sally and Anderson
Baseball
NFL
NBA
Handball
Soccer
Trend en ruis
Trend en ruis
De Nederlandse school ….?
Nederlandse school - deel 2
Feyenoord tijdens 7 opeenvolgende verlieswedstrijden
Tegenstander Balbezit Uitslag
NEC 52% L
PSV 61% L
AZ 59% L
Heerenveen 60% L
ADO Den Haag 64% L
Ajax 39% L
PEC Zwolle 56% L
Roda JC 61% G
FC Utrecht 48% W
Voorbeeld uit de praktijk
• Heracles – Heerenveen
• 1-1 bij rust
• Heerenveen blijkt in de eerste 15 minuten na rust:
– De grootste kans op tegendoelpunten te hebben (conversie)
– De meeste kansen tegen te krijgen (aantal schoten)
• Dus, wat ga je doen?
Penalty Kicks
Penalty Kicks
Uitstapje:WK 2014
Welke analyses had van Gaal?
• D#
• 1 : 4
Tegendoelpunten Spanje (pre-WK)
Een alternatieve kijk - 1
Expected goals
• Beoordelingsmodel ‘kansen’
• Variabelen:
– Location (dichterbij is beter)
– Soort poging (voeten > hoofd)
– Waar begon balbezit? (omschakeling vs opbouw)
– Hulp gekregen? (steekpass > assist > geen assist)
– Aantal balaanrakingen (hoe meer hoe beter)
– En meer…
Manchester City - Feyenoord
Voorbeelden uit de praktijk
Voorbeelden uit de praktijk
Een alternatieve kijk - 2
Bron:
Lotte Bransen
Sci-Sports
Wat is het probleem?
• Meeste aanpakken focussen op:– Assists en keypasses– Passnauwkeurigheid (%)
• Assists en keypasses zijn zeldzaam -> informatie gaat verloren
• Passnauwkeurigheid -> ‘makkelijke’ en ‘moeilijke’ passes hetzelfde gewaardeerd
• Oplossing: een waarde geven aan alle passes
Databeschrijving
• Ball event data
• 5 seizoenen (2012-2017) top 5 competities
• 8.6 miljoen passes
• Waarvan 6.6 miljoen aangekomen
Pass-oriented pass value (PPV)
• Stap 1: Vind de 100 naaste buren (passes)
• Stap 2: Vind hun possession sequence uitkomst (doelpoging of niet)
• Stap 3: PPV = gemiddelde possession sequence uitkomst van de 100 naaste buren
Pass-oriented pass value (PPV)
Resultaten – 2016/2017 PPV methode
PPV = 0.305
PPV = 0.0444
Resultaten – 2016/2017 PPV methode
Top 10 spelers onder 22:
1. Alex Iwobi
2. Maxime Lopez
3. Kingsley Coman
4. Thomas Lemar
5. Ousmane Dembélé
6. Marco Asensio
7. Renato Sanches
8. Leroy Sané
9. Julian Brandt
10.Harry Winks