Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017....

61
Data Science and Sports 16 Januari 2017 Anatoliy Babic

Transcript of Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017....

Page 1: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option

Data Science and Sports

16 Januari 2017Anatoliy Babic

Page 2: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option
Page 3: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option

Optiver Sep/2014 -Sep/2015

• Market Maker

• Bovespa – 12 Small Stocks Option Portfolio

Page 4: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option

Science Sports

Page 5: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option

Waar het allemaal mee begon

Statistieken uit (semi-)openbare databronnen worden gecombineerd

Het SciSports algoritme waardeert spelers op basis van vaste

kenmerken

Het SciSports zoeksysteem vindt spelers die matchen met het

spelersprofiel

De club geeft aan welk spelerstype zij graag aan zou trekken

Page 6: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option
Page 7: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option

Naamsbekendheid SciSports

• Startup Competities – oa PHIA, Kairos 50

• Diverse Media – Krant, Radio, TV, VI

• Tweede Kamer

• Next European Unicorn

Page 8: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option

Subjectiviteit in de Voetbalwereld

Page 9: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option

QuizFeiten en Mythes uit de

voetbalwereld

Page 10: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option

Vraag 1:

Wie is de all-time topscorer van het Nederlands Elftal?

Linker hand: Johan CruijffRechter hand: Robin van Persie

Page 11: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option

Vraag 1:

Wie is de all-time topscorer van het Nederlands Elftal?

Linker hand: Johan Cruijff 31 0.69 per match

Rechter hand: Robin van Persie 50 0.49 per match

Page 12: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option

Vraag 2:

Wie scoorde de eerste eigen goal voor het Nederlands Elftal?

Linker hand: Dico DefizeRechter hand: Ben Stom

Page 13: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option

Vraag 2:

Wie scoorde de eerste eigen goal voor het Nederlands Elftal?

Linker hand: Dico DefizeRechter hand: Ben Stom

Page 14: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option

Vraag 3:

Wie is de uitvinder van sportstatistiek?(sabermetrics)

Linker hand: Bill JamesRechter hand: Sepp Blatter

Page 15: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option

Vraag 3:

Wie is de uitvinder van sportstatistiek?(sabermetrics)

Linker hand: Bill JamesRechter hand: Sepp Blatter

Page 16: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option

Vraag 4:

Wie scoorde het meeste doelpunten in het seizoen 2014/2015?

Linker hand: Lionel MessiRechter hand: Cristiano Ronaldo

Page 17: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option

Vraag 4:

Wie scoorde het meeste doelpunten in het seizoen 2014/2015?

Linker hand: Lionel Messi 58Rechter hand: Cristiano Ronaldo 61

Page 18: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option

Vraag 5:

“Of all the unimportant things, Football is the most important?”

Linker hand: Johan CruijffRechter hand: Pope John Paul II

Page 19: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option

Vraag 5:

“Of all the unimportant things, Football is the most important?”

Linker hand: Johan CruijffRechter hand: Pope John Paul II

Page 20: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option

Vraag 6:

“Wie gaf de meeste assists in de Spaanse Primera Division (2016/2017)?”

Linker hand: Luis SuarezRechter hand: Neymar

Page 21: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option

Vraag 6:

“Wie gaf de meeste assists in de Spaanse Primera Division (2016/2017)?”

Linker hand: Luis Suarez 13Rechter hand: Neymar 11

Page 22: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option

Vraag 7:

“Welk percentage corners leidt tot een doelpunt?”

Linker hand: 3 procentRechter hand: 12 procent

Page 23: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option

Vraag 7:

“Welk percentage corners leidt tot een doelpunt?”

Linker hand: 3 procentRechter hand: 12 procent

Page 24: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option

Vraag 8:

“Welke club baseerde al hun strategische beslissingen op statistiek en werden in 2015 kampioen van hun

competitie?”

Page 25: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option

Vraag 8:

FC Midtjylland(Denemarken)

Page 26: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option

Linker hand: WaarRechter hand: Onwaar

Question 9:“Kinderen geboren in Januari hebben een hogere kans om geselecteerd te

worden als profvoetballer.”

Page 27: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option

Linker hand: WaarRechter hand: Onwaar

Maar waarom?

Question 9:“Kinderen geboren in Januari hebben een hogere kans om geselecteerd te

worden als profvoetballer.”

Page 28: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option

Relative Age Effect

Page 29: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option

The initial idea of SciSports

Page 30: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option

Waar het allemaal mee begon

Statistieken worden gescrapeduit (semi-)openbare databronnen

Het SciSports algoritme waardeert spelers op basis van vaste

kenmerken

Het SciSports zoeksysteem vindt spelers die matchen met het

spelersprofiel

De club geeft aan welk spelerstype zij graag aan zou trekken

Page 31: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option

Voorbeeld - Wout Weghorst

Page 32: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option

Voorbeeld – Memphis Depay

Page 33: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option

The SciSports Proposition

Page 34: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option

Welke Nederlandse speler is het beste?

Page 35: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option

Data Intelligence

Page 36: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option

Overzicht Bedrijf SciSports

Page 37: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option

Onze Producten

Page 38: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option

Data Intelligence

Page 39: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option

SciSports: SciSkill Potential Index

Page 40: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option
Page 41: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option

SciSports: Expected Goals

Page 42: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option

SciSports Intelligence: Building the algorithms

Page 43: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option

Kunnen we op deze manier ook passes waarderen?

Page 44: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option
Page 45: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option

Sequence-oriented pass value (SPV)

• Stap 1: Vind waarde

possession sequence tot

aan pass

Page 46: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option

Sequence-oriented pass value (SPV)

• Stap 1: Vind waarde

possession sequence tot

aan pass

• Stap 2: Vind waarde

possession sequence

inclusief pass

Page 47: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option

Sequence-oriented pass value (SPV)

• Stap 1: Vind waarde

possession sequence tot

aan pass

• Stap 2: Vind waarde

possession sequence

inclusief pass

• Step 3: SPV = waarde

stap 2 – waarde stap 1

Page 48: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option

Resultaten –2016/2017 PPV methode

Page 49: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option

Resultaten – 2016/2017 PPV methode

PPV = 0.305

PPV = 0.0444

Page 50: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option

Playing Style Characterization

Page 51: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option
Page 52: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option

SciSports: Expected Points

Page 53: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option

SciSports: Expected Points

Page 54: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option

SciSports: Individual Match Predictions

Page 55: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option
Page 56: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option
Page 57: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option

We track voxels to make the stadium like an MRI system and generatereal-time 3D data of allplayers and the ball

Page 58: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option
Page 59: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option
Page 60: Data Science and Sports Anatoliy Babic 16 Januari 2017 SciSp… · Anatoliy Babic 16 Januari 2017. Optiver Sep/2014 -Sep/2015 •Market Maker •Bovespa –12 Small Stocks Option

Automatische Spelersherkenning

1. Frame-extraction and overview shot filter.

2. Due to moving cameras, Automatic Field Segmentationis important for filtering background noise.

3. A classifier quickly scans the entire image finding the players.

4. A Convolutional Neural Network (CNN) removes samples where the shirt-number is not visible.

5. Another CNN analyses the shirt-number, we combine this with our team-classification to recognize the player.