1 UM Stratego Colin Schepers Daan Veltman Enno Ruijters Leon Gerritsen Niek den Teuling Yannick...

UM Stratego

Colin SchepersDaan VeltmanEnno RuijtersLeon Gerritsen

Niek den TeulingYannick Thimister

Introduction Yannick The game of Stratego Daan Evaluation Function Leon Monte Carlo Colin Genetic Algorithm Enno Opponent modeling and strategy Niek Conclusion

Yannick

Content

The game of Stratego

Board of 10x10

Setup field 4x10

B Bombs 1 Marshall 2 General 3 Colonels 4 Majors 5 Captains

6 Lieutenants 7 Sergeants 8 Miner 9 Scout S Spy F Flag

WinFlag captureUnmovable pieces

DrawUnmovable piecesMaximum moves

Starting Positions

Flag placed Bombs placed Remaining pieces placed randomly

Starting Positions

Distance to Freedom Being bombed in Partial obstruction Adjacency

Flag defence Startup Pieces

Starting Positions

Distance to Freedom

Starting Positions

Startup Pieces

Sub-functions of the evaluation function: Material value Information value Near enemy piece value Near flag value Progressive bonus value First-move penalty

Evaluation Function

How it works: All the sub-functions return a value These values are then weighted and added to

each other The higher the total added value, the better

that move is for the player

Evaluation Function

Material Value: Used for comparing the two players' board

strengths Each piece type has a value Total value of the opponent's board is

subtracted from the player's board value Positive value means strong player board Negative value means weak player board

Evaluation Function

Information value: Stimulates the collection of opponent information

and the keeping of personal piece information Each piece type has a certain information value All the values from each side are summed up and

then substracted from each other A marshall being discovered is worse than a

scout being discovered

Evaluation Function

Near enemy piece value Checks if a moveable piece can or cannot

defeat a piece next to it If piece can be defeated, return positive

score If not, return a negative one If piece unknown, return 0

Evaluation Function Near flag value

Stimulates the defence of own flag and the attacking of enemy's flag

Constructs array with possible enemy flag locations

If enemy near own flag, return negative number If own piece near possible enemy flag, return

positive number

Evaluation Function

Progressive bonus value Stimulates the advancement of pieces

towards enemy lines Returns a positive value if piece moves

forward Negative if backward

Evaluation Function

First-move valueKeeps pieces from giving away informationKeeps the number of unmoved pieces high

Monte Carlo A subset of all possible moves is played

No strategy or weights used Evaluation value received after every move

At the end a comparison of evaluation values determines the best move

A depth limit is used so the tree doesn't grow to big and the algorithm will end at some point

Monte Carlo

Advantages:

Simple implementation Can be changed quickly Easy observation of behavior Good documentation Good for partial information situations

Monte Carlo

Disadvantages:

Generally not smart Dependent on the evaluation function Computationally slow

Tree grows very fast

Monte Carlo Experiments

MC against lower-depth MC

Player Wins Losses Draw

MC 28 59 49

MC-LD 59 28 49

MC against no-depth MC

MC 15 2 12

MC-ND 2 15 12

MC against deeper-depth but narrower MC

MC 5 2 11

MC-DDN 2 5 11

MC against narrower MC

MC 62 18 85

MC-N 18 62 85

Genetic Algorithm

Evolve weights of the terms in the evaluation functions

AI uses standard expectiminimax search tree Evolution strategies (evolution paremeters are

themselves evolved)

Genetic Algorithm

Genome:

Mutation:

G= σ,α,w1,. .. ,wn

σ n=σ n−1⋅eN 0,τ

α n=α n−1+α n⋅N 0,σ w i,n= w i,n−1w i,n−1⋅N 0,σ

Genetic Algorithm

Crossover: σ and α of parents average weights:

Averaged if Else randomly chosen from parents

1α<ratio<α

Genetic Algorithm

Fitness function: Win bonus Number of own pieces left Number of turns spent

Genetic Algorithm

Reference AI: Monte Carlo AI Self-selecting reference genome

Select average genome from each generation

Pick winner between this genome and previous reference

Hill climbing

The GA takes too long to train Hill climbing is faster

Opponent modeling

Observing moves Ruling out pieces Stronger pieces are moved towards you Weaker pieces are moved away

Opponent modeling

No knowledge about enemy pieces at the start Updating the probabilities

Update the probability of the moving piece Update probabilities of all other pieces

MC against MC with opponent modeling using a database of Human versus human games

MC 39 44 58

MC-OM 44 39 58

MC against MC with opponent modeling using a database of MC versus MC games

Strategy

Split the game up into phases Exploration phase

Until 25% of enemy pieces are identified Elimination phase

Until 70% of enemy pieces are killed End-game phase

Alter the evaluation function

Conclusion

Both AIs are very slow The genetic AI takes too long to train

In case of Stratego, tweaking a few weights may not be an optimal way to create an intelligent player

1 UM Stratego Colin Schepers Daan Veltman Enno Ruijters Leon Gerritsen Niek den Teuling Yannick...

Documents

Transcript of 1 UM Stratego Colin Schepers Daan Veltman Enno Ruijters Leon Gerritsen Niek den Teuling Yannick...

Akabe De Pioen Nieuwsbrief...echte race eerst winnende de ene groep en dan de andere het was super spannende. Na de uitputtende stratego stond de leiding met een vieruurtje en een

Stratego Legends

Sponsormap Ruijters Eaters Geleen

Inhoudsopgave werkgroepen - WND-conferentie€¦ · Aernout van Rossum, Ed van den Berg, Wim Sonneveld en Enno van der Laan . Karakter: actieve werkgroep met zelfwerkzaamheid van

IPhO Problem Sheet Experimental enno · 2017. 3. 7. · De kromming van het water kun je met grote nauwkeurigheid bepalen door de reflectie van de laserstraal aan het wateroppervlak

In bloei trekken… · 2018. 2. 3. · In bloei trekken… Leren ontwikkelen van mens en organisatie Manon C.P. Ruijters. Uitgever: Stoas Hogeschool Vormgeving: Siger Smit ... Over

Marketing Stratego

Stratego voor vrouwen...Stratego® voor vrouwen biedt vrouwen een handvat om carrière te maken en ‘het spel’ strategisch te spelen, zonder dat hun vrouw-zijn daarbij in het geding

Binnenwerk Vrouwen bluffen niet 320 - Businezz · handleiding geschreven, in de vorm van het boek Stratego® voor vrouwen. Nu dan een boek voor mannen, waarin we een kijkje bieden

Responsief leiderschap in AOC - NRO · 2020. 10. 16. · Manon Ruijters Wageningen Wageningen| 14 november Responsief leiderschap in AOC NRO startbijeenkomst projecten in het groene

Ouderbijdrage: 'Wat is er mis met levend stratego?' Toestroom ...

De Transportfiets - Amazon S3...Jos Jacobs, Marco Rorai en Enno van Waardenberg. Foto´s zijn van Fietsersbond Capelle a/d IJssel en/of met toestemming overgenomen. De Fietsersbond

Het ABC | Onderwijsadviseurs voor Amsterdam en …...Spelletjestip: Stratego, schaken, dammen en rummikub (bedenk een goede strategie en houd je eraan!). 18 Mijn brein logboek Organisatie

Kopen en Werken De herziene versie van Kopen en Werken Enno Noordhoff, Luc Repriels 1.

Datum: 08-07 / 14-07 - Camping Rolanduuid:...20.00 STRATEGO VAN STOERE PIRATEN WOENSDAG 23 AUGUSTUS 10.00 FLESSENPOST EN PIRATENVLAGGEN MAKEN 14.00 PIRATENKWARTET 19.00 MINIDISCO 20.00

De levensloopbestendige buurt Samenredzaamheid met de beurs van nu Roger Ruijters Raad van bestuur MeanderGroep 1.

JAARTALPUZZEL STATENKWARTIER puzzel · 2017. 3. 27. · Na de Torentjespuzzel in 2011 en de Dierenornamentenpuzzel in 2013 heeft Maarten Ruijters nu deze puzzel Jaartalpuzzel gemaakt.

Slimmer werken met (meta)data Enno Meijers - 25 mei 2016 · Slimmer werken met (meta)data Enno Meijers - 25 mei 2016. Inhoud •De wereld verandert •Metadatastromen bij (openbare)

Rare dieren stratego - Spelen en Leren · Rare dieren stratego Yura Gerritsen Rare dieren stratego Deel de groep in twee kleinere groepen en spreek een terrein af. Beide groepen hebben

Het oudste kopergeld in de Nederlanden / door H. Enno van Gelder