Competitive Predictive Analytics - Tim Salimans op Nyenrode

41
Compe&&ve Predic&ve Analy&cs Tim Salimans

description

Tim is de oprichter van Algoritmica en een van de beste data scientists in de wereld. Via het competitief data analyse platform Kaggle weet hij keer op keer voor bedrijven als Microsoft, Deloitte en Allstate met slimme algoritmes en grote hoeveelheden data de competitie te winnen. Op dit moment is hij in de running voor een prijs van 3 miljoen dollar. In het verleden heeft hij onder andere elektronische trading en market making strategieën gemaakt voor de gokbranche en was verantwoordelijk voor 3% van alle transacties binnen de multi-miljoenen markt van paardenraces. Tim heeft in 2011 de ‘Top Lecturer Award’ van de Erasmus Universiteit gewonnen en heeft inmiddels twee keer in Forbes gestaan. Tim gaat een zeer inspirerend verhaal over zijn activiteiten vertellen waar elke marketeer veel van kan leren.

Transcript of Competitive Predictive Analytics - Tim Salimans op Nyenrode

Page 1: Competitive Predictive Analytics - Tim Salimans op Nyenrode

Compe&&ve  Predic&ve  Analy&cs  

Tim  Salimans  

Page 2: Competitive Predictive Analytics - Tim Salimans op Nyenrode

Predictive Analytics

¨  Marketing beslissingen worden gemaakt onder onzekerheid

¨  De juiste beslissing vraagt om een voorspelling ¤ Verwachte opbrengst versus kosten ¤ Welke actie op welk moment voor het beste resultaat?

¨  Predictive Analytics is het gebruik van data om deze voorspellingen zo goed mogelijk te maken

¨  Algoritmica helpt bedrijven hierbij

Page 3: Competitive Predictive Analytics - Tim Salimans op Nyenrode

Competitie

Page 4: Competitive Predictive Analytics - Tim Salimans op Nyenrode

Kaggle

¨  Platform voor predictive analytics competitions

Page 5: Competitive Predictive Analytics - Tim Salimans op Nyenrode

Kaggle

¨  Platform voor predictive analytics competitions

¨  Bedrijf stelt gedeelte van de data beschikbaar, houdt deel van de data achter

¨  Deelnemers bouwen modellen op beschikbare data ¨  Deelnemers voorspellen de waardes van de

achtergehouden data ¨  Beste voorspelling wint de competitie

Page 6: Competitive Predictive Analytics - Tim Salimans op Nyenrode

3 Soorten Competities

¨  Case competitions

¤ Competities voor het vinden van de beste oplossing voor een case

¨  People competitions ¤ Competities voor het vinden van de beste mensen

¨  Algorithm competitions ¤ Competitie tussen algoritmes

Page 7: Competitive Predictive Analytics - Tim Salimans op Nyenrode

Case competitions

¨  Definieer de business case ¤ Welke beslissing moet worden gemaakt? ¤ Welke bronnen van onzekerheid zijn er? ¤ Welke informatie is belangrijk? ¤ Hoe wordt het resultaat gemeten?

¨  Ontsluit relevante data voor deze case ¨  Schrijf een wedstrijd uit voor de beste oplossing

Page 8: Competitive Predictive Analytics - Tim Salimans op Nyenrode

Allstate Customer Retention Competitie

¨  Allstate is een grote Amerikaanse autoverzekeraar ¨  Premie verzekering toegespitst op klant

¤  Te hoog: klant stap over ¤  Te laag: verzekeraar maakt verlies

¨  Veel data beschikbaar over klanten ¤  Schadevrij? ¤ Hoe lang al klant? ¤ Hoe oud? ¤ Welk merk auto? ¤ Waar woont de klant?

¨  Vraag: welke premie om klant te behouden?

Page 9: Competitive Predictive Analytics - Tim Salimans op Nyenrode

Allstate Customer Retention Competitie

¨  3 jaar data beschikbaar gesteld ¤ Aangeboden premie ¤ Klantgegevens ¤ Bleef de klant of niet?

¨ ½ jaar test data ¤ Aangeboden premie is gegeven ¤ Voorspellen of de klant bleef of niet

Page 10: Competitive Predictive Analytics - Tim Salimans op Nyenrode

Allstate Customer Retention Competitie

Page 11: Competitive Predictive Analytics - Tim Salimans op Nyenrode

Deloitte/FIDE chess rating challenge

¨  10 jaar resultaten van schaakwedstrijden

¨  2 jaar achtergehouden, deze moeten worden voorspeld

à A verslaat B, B verslaat C, wat is de kans dat A wint van C?

¨  Gesponsord door wereld schaak federatie FIDE and Deloitte Australia

Page 12: Competitive Predictive Analytics - Tim Salimans op Nyenrode

Deloitte/FIDE chess rating challenge

FIDE maakt gebruik van het Elo systeem ¨  Elke speler krijgt een rating ¨  Voorspelde resultaat is een functie van het verschil in

ratings tussen de spelers ¨  Rating punten worden verdeeld op basis van dit

rating verschil en de uitslag

Page 13: Competitive Predictive Analytics - Tim Salimans op Nyenrode

Deloitte/FIDE chess rating challenge

Elo system

Page 14: Competitive Predictive Analytics - Tim Salimans op Nyenrode

Deloitte/FIDE chess rating challenge

Problemen met het Elo systeem

¨  Onzekerheid wordt niet correct meegenomen ¨  Het kijkt niet terug in de tijd ¨  Resultaten uit het verleden worden niet goed gewogen

¨  Niet alle informatie bevind zich in de uitslag…

Page 15: Competitive Predictive Analytics - Tim Salimans op Nyenrode

Deloitte/FIDE chess rating challenge

TrueSkill ¨  Bayesiaanse variant Elo ¨  Ontwikkeld bij Microsoft ¨  Gebruikt voor rating Halo

spelers

¨  Aanpassen om resultaten goed te wegen en alle informatie mee te nemen

Page 16: Competitive Predictive Analytics - Tim Salimans op Nyenrode

Deloitte/FIDE chess rating challenge

¨  Eerste poging

¨  Dat is makkelijk!

Page 17: Competitive Predictive Analytics - Tim Salimans op Nyenrode

Deloitte/FIDE chess rating challenge

¨  2 weken later

¨  Ik krijg al wat meer competitie

Page 18: Competitive Predictive Analytics - Tim Salimans op Nyenrode

Deloitte/FIDE chess rating challenge

¨  Weer 2 weken later

Page 19: Competitive Predictive Analytics - Tim Salimans op Nyenrode

Deloitte/FIDE chess rating challenge

¨  1 week later

¨  Weer #1!

Page 20: Competitive Predictive Analytics - Tim Salimans op Nyenrode

Deloitte/FIDE chess rating challenge

¨  1 dag later

¨  Dat duurde niet lang

Page 21: Competitive Predictive Analytics - Tim Salimans op Nyenrode

Deloitte/FIDE chess rating challenge

En toen moest ik naar een conferentie in St. Louis….

Page 22: Competitive Predictive Analytics - Tim Salimans op Nyenrode

Deloitte/FIDE chess rating challenge

¨  Jet lag: Bij gebrek aan slaap nog maar een laatste poging in de vroege morgen…

¨  Weer op de eerste plek!

Page 23: Competitive Predictive Analytics - Tim Salimans op Nyenrode

Deloitte/FIDE chess rating challenge

¨  En uiteindelijk…

¨  Gewonnen!

Page 24: Competitive Predictive Analytics - Tim Salimans op Nyenrode

Deloitte/FIDE chess rating challenge

Bedenkers TrueSkill deden ook mee Op hun uitnodiging 3 maanden gewerkt bij Microsoft Research Cambridge

Page 25: Competitive Predictive Analytics - Tim Salimans op Nyenrode

Heritage Health Prize

Page 26: Competitive Predictive Analytics - Tim Salimans op Nyenrode

People competitions

¨  Competitie om talent te ontdekken ¤ Extern: wie moet je aannemen? ¤  Intern: waar zit ons analytics talent?

¨  Deloitte: wereldwijde wedstrijd onder 100,000+ werknemers

¨  Facebook: recruiting competitions

Page 27: Competitive Predictive Analytics - Tim Salimans op Nyenrode

Observing Dark Worlds competition

¨  Recruiting competition van Winton Capital

¨  80% van de massa in the universum is donkere materie

¨  Donker: Straalt geen licht uit ¨  Wel zwaartekracht

àVind de locatie van donkere materie gebaseerd op de effecten van deze zwaartekracht

Page 28: Competitive Predictive Analytics - Tim Salimans op Nyenrode

Observing Dark Worlds competition

Page 29: Competitive Predictive Analytics - Tim Salimans op Nyenrode

Observing Dark Worlds competition

¨  Model ¤ Vervorming rond de

donkere materie ¤ Kracht van het effect

neemt af met 1/r ¤ Kracht afhankelijk van

de massa van materie

𝑒↓𝑡 ≈𝑚/𝑟 

Page 30: Competitive Predictive Analytics - Tim Salimans op Nyenrode

Observing Dark Worlds competition

¨  Resultaat: Heat map mogelijke locaties donkere materie

¨  Voorspelling: Punt dat de verwachte fout minimaliseert

Page 31: Competitive Predictive Analytics - Tim Salimans op Nyenrode

Observing Dark Worlds competition

Slim?

Middelmatige score!

Page 32: Competitive Predictive Analytics - Tim Salimans op Nyenrode

Observing Dark Worlds competition

¨  Leaderboard gebaseerd op maar 30 gevallen ¨  Einduitslag gebaseerd op 90 andere gevallen

Page 33: Competitive Predictive Analytics - Tim Salimans op Nyenrode

Kaggle in Class

Page 34: Competitive Predictive Analytics - Tim Salimans op Nyenrode

Kaggle in Class

Page 35: Competitive Predictive Analytics - Tim Salimans op Nyenrode

Algorithm competitions

Page 36: Competitive Predictive Analytics - Tim Salimans op Nyenrode

Financiële markten

¨  Ultieme voorspellingscompetitie ¨  Algoritmes handelen met elkaar ¨  Duidelijk doel: winst maken ¨  Geen duidelijke case

¤ Omgeving niet statisch

¨  Algoritmes voeren direct competitie voor beste handelsmogelijkheden

Page 37: Competitive Predictive Analytics - Tim Salimans op Nyenrode

Real-Time Ad Bidding

Page 38: Competitive Predictive Analytics - Tim Salimans op Nyenrode

Real-Time Ad Bidding

Page 39: Competitive Predictive Analytics - Tim Salimans op Nyenrode

Real-Time Ad Bidding

¨  RTB = competitieve marketing tussen algoritmes ¨  Het beste algoritme wint ¨  Dynamische setting

¤ Concurrentie verandert ¤ Consument verandert ¤ Publishers veranderen

¨  RTB de ultieme marketing predictive analytics competitie? ¨  Algoritmica werkt met FlxOne aan RTB oplossing

Page 40: Competitive Predictive Analytics - Tim Salimans op Nyenrode

Conclusies

¨  Competitie een nuttige lens voor het bekijken van predictive analytics ¤ Vinden van oplossingen ¤ Vinden van mensen

¨  Marketing en predictive analytics steeds competitiever

Page 41: Competitive Predictive Analytics - Tim Salimans op Nyenrode

Vragen?  

Blog:  TimSalimans.com  Consul&ng:  Algoritmica.nl  E-­‐mail:  &[email protected]