Zoeken met opponent-modellen Jeroen Donkers IKAT, Vakgroep Informatica, Universiteit Maastricht...

zoeken met opponent-modellen

Jeroen Donkers

IKAT, Vakgroep Informatica, Universiteit Maastricht

Promotor: H.J. van den Herik

Co-promotor: J.W.H.M. Uiterwijk

InhoudInhoud

• Het domein

• Zoeken met opponent-modellen

• Onderzoeksvraag

• Theoretische en experimentele resultaten

• Conclusies

Het domeinHet domein• Kunstmatige Intelligentie =

het verrichten van taken door computers die als typisch menselijk worden (werden) gezien

• Het spelen van bordspelen zoals schaken is een geliefd studiedomein

• In dit domein zijn al grote successen behaald (denk aan Deep Blue)

Het domeinHet domein

• Spelen vormen een gesloten en goed beschreven domein (vanwege de spelregels)

• We beperken ons hier tot spelen:– voor twee spelers (die om de beurt zetten)– zonder verborgen informatie– zonder kansaspect (dobbelstenen)– waarbij als één speler wint, de ander verliest

• Bijv. Schaken, Lines of Action, Bao

Een voorbeeld: Nim-5Een voorbeeld: Nim-5

• Neem om de beurt 1, 2 of 3 lucifers

• Degene die de laatste lucifer pakt, wint

Een voorbeeld: Nim-5Een voorbeeld: Nim-5

Winnaar

ZoekboomZoekboom

• De computer speelt het spel door eerst alle mogelijkheden voor beide spelers in een boom-vorm te representeren:

ZoekboomZoekboom

4 3 21 2 3

2 1 0 1 0 0

1 0 0 0

1 1 1 1

1 0 0 0 0

2 1 2 1 0 1

Stap 1: uitkomsten bepalen (vanuit speler “groen”)

ZoekboomZoekboom

2 1 0 1 0 0

1 0 0 0

1 1 1 1

+1 +1 +1 +1 +1 +1–1 –1 –1 –1 –1

1 0 0 0 0

2 1 2 1 0 1

Stap 2: uitkomsten terugvoeren

+1 –1

ZoekboomZoekboom

2 1 0 1 0 0

1 0 0 0

1 1 1 1

+1 –1 +1 +1 +1 +1 +1 +1–1 –1 –1 –1 –1

1 0 0 0 0

2 1 2 1 0 1

ZoekboomZoekboom

+1 –1 +1 +1 +1 +1 +1 +1–1 –1 –1 –1 –1

11 1 1

+1 –1 –1

–1 –1 +1 –1 +1 +1

–1 +1 +1 +1

1 1 1 1 1 1

–1+1

+1 –1 –1 –1 –1

+1 +1 +1 +1 –1 +1

Groen kan altijd winnen!

ZoekboomZoekboom

11 1 1

+1 –1 –1

–1 –1 +1 –1 +1 +1

–1 +1 +1 +1

1 1 1 1 1 1

–1+1

+1 –1 –1 –1 –1

+1 +1 +1 +1 –1 +1

Stap 3: optimale strategie bepalen

Heuristisch zoekenHeuristisch zoeken

• Voor interessante spelen zoals schaak kan de zoekboom onmogelijk volledig worden opgesteld

• Daarom wordt de boom “afgekapt” op een zekere diepte

• Bovendien wordt er in de boom “gesnoeid” om de efficiëntie te verhogen

Heuristisch zoekenHeuristisch zoeken

.25 –1 –1

–1.25 .33 .5 .33 .5 –1 .5

Bij het afkappen van de boom wordt een heuristische evaluatiefunctie gebruikt in plaats van de echte uitkomst

Opponent-modellenOpponent-modellen• De evaluatiefunctie bepaalt in grote mate de

strategie van een speler• De evaluatiefunctie kan daarom als

opponent-model dienen

• Stel dat we de evaluatiefunctie van de tegenstander kennen, kunnen we er dan ons voordeel mee doen?

Opponent-Model SearchOpponent-Model Search

• Iida et al (`93) Carmel & Markovitch (`93)

• Een zoekmethode die er vanuit gaat dat de evaluatiefunctie van de opponent bekend is:– voorspelt eerst welke zet een opponent zou

doen met deze evaluatiefunctie– kiest dan op basis van de eigen evaluatiefunctie

welke eigen zet het beste lijkt

ProbabilisticOpponent-Model SearchProbabilisticOpponent-Model Search• Donkers et al (2000)

• Het opponent-model is een mix van een aantal opponent-types, ieder met een eigen evaluatiefunctie

• De werking is verder ongeveer gelijk aan die van Opponent-Model Search: eerst voorspellen en dan een eigen keuze maken

OnderzoeksvraagOnderzoeksvraag

• Onder welke condities kunnen OM search en PrOM search het spelen door computers verbeteren

• Er is zowel theoretisch als empirisch onderzoek gedaan

Theoretische resultatenTheoretische resultaten

• Er bestaat een manier om beide zoekmethoden efficiënt te programmeren, maar:

• PrOM Search kost meer rekentijd dan OM Search voor de zelfde zoekboom

• Beide methoden kosten veel meer rekentijd dan de traditionele aanpak

Theoretische resultatenTheoretische resultaten

• OM Search heeft last van risico’s, een aantal daarvan waren al bekend:– het opponent-model kan verkeerd zijn– de voorspellingen kunnen fout zijn– de eigen evaluatiefunctie kan slechter zijn dan

die van de tegenstander

• Maar er is een extra risico:

Theoretische resultatenTheoretische resultaten• Overschattingen in de eigen

evaluatiefunctie kunnen leiden tot rampen:– de opponent wordt gelokt naar een positie

waarvan je onterecht verwacht dat die heel aantrekkelijk is

– de opponent weet wel beter en gaat fluitend met je mee

– hoe groter de overschatting, hoe liever je er heen wilt...

Experimentele resultatenExperimentele resultaten

• Wanneer je OM Search onbezonnen toepast, zijn de resultaten zeer slecht, vergeleken met de traditionele aanpak:– kost meer rekentijd– je verliest vaker, zelfs met perfecte kennis van

de opponent

• PrOM Search is wel veiliger, maar kost ook veel meer rekentijd

Experimentele resultatenExperimentele resultaten• OM Search werkt redelijk als:

– je absolute kennis hebt (eindspel)– je perfecte kennis van de opponent hebt– je niet zomaar overschattingen maakt– je extra tijd hebt om goed te voorspellen

• PrOM Search presteert dan over het algemeen beter dan OM Search, heel soms zelfs beter dan de traditionele aanpak

ConclusiesConclusies

• Onbezonnen toepassen van OM Search en PrOM search is onverstandig

• Het is niet alleen belangrijk de opponent goed te kennen (Nosce Hostem), je moet ook je eigen evaluatiefunctie goed kennen (Nosce Te Ipsum)

Thales van Milete (640 vC)Thales van Milete (640 vC)

Soen Tzoe (500 vC)Soen Tzoe (500 vC)

“Ken uw vijand, ken u zelfen uw overwinning is onbedreigd.”

Zoeken met opponent-modellen Jeroen Donkers IKAT, Vakgroep Informatica, Universiteit Maastricht...

Documents

Transcript of Zoeken met opponent-modellen Jeroen Donkers IKAT, Vakgroep Informatica, Universiteit Maastricht...

Giardia najaarsdag 2014 uiterwijk dierenartsen

1. WAAROM EEN VENNOOTSCHAP OPRICHTEN? · Web viewDe raad van bestuur kan beslissen om de verbintenis van een promotor niet over te nemen, waardoor de promotor individueel met de

Store Promotor

Thuis in verandering An Katrien Sodermans Sofie Vanassche Promotor: Prof. Dr. Koen Matthijs Cederdialogen, dinsdag 19 maart 2013.

Mathilde Uiterwijk WORM CHECK hond kat opleiding Deel I … · 2018-11-07 · • Eigenschappen van de testen → test kiezen • Uitvoer • Om rekening mee te houden 303‐11‐2018

photonics.intec.ugent.beUniversiteit Gent Faculteit Ingenieurswetenschappen en Architectuur Vakgroep Informatietechnologie Promotor: Prof. Dr. Ir. Dries Van …

‘Uit het oog verloren’: de gevolgen van detentie voor ... · Furniere Laure (00603029) geeft hierbij aan derden, zijnde andere personen dan de promotor (en eventuele co-promotor),

CURRICULUM JOSE DIAZ (Luis Jose Diaz) Promotor

Promotor Prof. dr. Anne-Laure Van Bruaene Vakgroep Geschiedenis · Promotor Prof. dr. Anne-Laure Van Bruaene Vakgroep Geschiedenis Decaan Prof. dr. Gita Deneckere Rector Prof. dr.

Stijn Adams Promotor Prof. dr. ir. Erik Duval Begeleider Dr. Joris Klerkx 25 maart 2013 1.

19 football Rec BK - Collinsville Presscollinsvillepress.com/wp-content/uploads/2019/09/...MOST YARDS RUSHING IN A GAME Player School Yards Att. Year Opponent Date Zach Davis Sheehan

Koen Struyve - Ghent Universitycage.ugent.be/geometry/Theses/42/kstruyve.pdfKoen Struyve Promotor : Prof.Dr.H.VanMaldeghem Co-promotor : Dr. K. Thas Proefschrift voorgelegd aan de

PROJECTCODE: GG/LEA/WEH15/12 PROMOTOR: Interlokale … · 2020-03-03 · 1 PROJECTTITEL: Forum Jeugd PROJECTCODE: GG/LEA/WEH15/12 PROMOTOR: Interlokale vereniging Westhoekpersoneel

Promotor: Prof. dr. Wouter Vanderplasschen Co -promotor : Prof. … · 2016-02-25 · Project D: Recover De Schone en het Beest Persoonlijk herstel binnen een forensische context

Teamindeling seizoen 2011-2012 Versie 3 Teams... · A 2 Uiterwijk Levi A 2 Vanmaekelberg h Cyriel A 2 Voorwerk Rody A 2 Vrede Jeremy A 3 Teamleiders Vincent Frowijnn Lucien 06-40461449

Pieter Bamps(2 de master CW) Begeleider: Joris Klerkx Promotor: E.Duval.

Promotor: Mark Elchardus - Vlaanderen

Steunpunt Milieu en Gezondheid 3... · Steunpunt Milieu en Gezondheid 4de generatie 2016-2020 Promotor coordinator: Prof. Dr. Greet Schoeters (VITO and UAntwerpen) Promotor on behalf

Secure Distributed Computing Gregory Neven (3CW Pr.) Promotor: Prof. Dr. ir. Frank Piessens.

Multispectrale Rendering Peter Vangorp Koen Yskout Promotor: Prof. Dr. ir. Ph. Dutré Begeleider: K. vom Berge.