Speltheorie

In de speltheorie gaat het om het onderzoeken van een spel met meerdere spelers, minstens 2. Alle spelers kunnen kiezen welke strategie ze volgen. De gevolgde strategie leidt tot een zekere uitbetaling (pay-off). Als speler wil je een zo hoog mogelijke uitbetaling, dus het gaat om het vinden van de beste strategie.

Speltheorie kent veel toepassingen in de economie.
Een voorbeeld is 'prijsstelling': de prijs van een product laat je afhangen van andere (concurrerende) verkopers. Ben je duurder dan verkoop je niks, ben je veel goedkoper dan kan er wel eens een moordende prijzenslag volgen waar je zelf de dupe van bent. De vraag is wat de juiste prijsstelling is.
Een ander voorbeeld is een sollicitatie: de sollicitant speelt tegen de mogelijke werkgever. Zetten zijn: salarisaanbod door de werkgever, beschrijving van je capaciteiten door de sollicitant, enzovoorts.

Hoe de speltheorie in elkaar zit kun je het beste zien aan de hand van een heel eenvoudig spel en van het zogenaamde 'gevangenendilemma'. Dit zijn beide noncoöperatieve spelen, de spelers werken niet samen. Er zij ook situaties te bedenken waarin de spelers coalities kunnen vormen, dat spreek je van een coöperatief spel.

Voorbeeld 1: Morra

Jij speelt als A tegen B een spel met twee vingers: tegelijkertijd steken beiden 1 of 2 vingers uit. Er zijn dan vier mogelijkheden:

beiden steken 1 vinger uit: 1 – 1
A steekt 1 en B steekt 2 vingers uit: 1 – 2
A steekt 2 en B steekt 1 vingers uit: 2 – 1
beiden steken 2 vingers uit: 2 – 2

Uitbetalingssysteem I:
Stel je voor dat de uitbetaling voor speler A zo is: A betaalt 3 euro bij 1 – 1 en anders krijgt hij net zoveel euro als het aantal keren dat er 2 vingers worden uitgestoken. De uitbetalingsmatrix voor A ziet er dan zo uit:

		B
		1 vinger	2 vingers
A	1 vinger	–3	1
A	2 vingers	1	2

In dit spel is de te volgen strategie snel te bepalen als je een bijpassend boomdiagram maakt. A zal altijd 2 vingers spelen en B (die dit ook wel snapt) altijd 1 vinger om zijn verlies te minimaliseren, kortom er wordt altijd 2 – 1 gespeeld. Deze strategie ligt van tevoren vast (als beide spelers zo slim mogelijk spelen): het spel is strikt gedetermineerd. Dat komt omdat er een punt in de uitbetalingsmatrix is dat tegelijk het maximum in zijn kolom en het minimum in zijn rij is. Dit punt heet zadelpunt. Als de waarde van zo'n zadelpunt 0 is, is er sprake van een eerlijk spel.

Uitbetalingssyteem 2:
Als het totaal van de uitgstoken vingers even is krijgt A precies 1 euro van B, anders krijgt B voor elke uitgestoken vinger een euro van A. De uitbetalingsmatrix wordt nu:

		B
		1 vinger	2 vingers
A	1 vinger	2	–3
A	2 vingers	–3	4

Nu is er geen zadelpunt, het spel is niet strikt gedetermineerd.
Wil je nu de gunstigste strategie voor A bepalen bekijk je zijn verwachte uitbetaling.
Stel dat voor A de relatieve frequentie waarmee hij 1 speelt a is en de relatieve frequentie waarmee hij 2 speelt is 1 – a. Voor speler B is dat achtereenvolgens b en 1 – b.
De verwachte uitbetaling E is nu voor A:

E(A)=2ab – 3a(1 – b) – 3b(1 – a) + (1 – a)(1 – b)=12ab – 7(a + b) + 4

Deze verwachte uitbetaling moet nu zo groot mogelijk worden, dus je zoekt een maximum op het gebied waarin 0 < a < 1 en 0 < b < 1.
De waarde van a waarbij het maximum optreedt is wel te bepalen, bijvoorbeeld met behulp van een spreadsheet zoals Excel. Probeer maar eens...
Je weet met de waarde van a (bijvoorbeeld in twee decimalen) in hoeveel procent van de spelletjes je 1 moet spelen om een zo hoog mogelijke winst te behalen.

Voorbeeld 2: Het gevangenendilemma

Twee misdadigers A en B die samen een bank hebben beroofd worden gepakt. Als A bekent en B niet, wordt A getuige en daarom vrijgelaten en krijgt B 20 jaar cel. Andersom als B bekent en A niet wordt B vrijgelaten en krijgt A 20 jaar cel. Als beiden niet bekennen krijgen ze elk 2 jaar cel (gebrek aan bewijs). Als beiden bekennen krijgen ze elk 5 jaar cel.

De optimale strategie is duidelijk: als beiden de mond houden krijgen ze elk 2 jaar.
Denkbaar is echter dat A eerst de voor hem gunstigste keuze maakt: hij bekent. Dan zal ook B vervolgens de voor hem nog meest gunstige strategie kiezen: hij bekent ook. Nu krijgen ze elk 5 jaar cel. Dit noem je een evenwichtsstrategie, de bijborende 'uitbetaling' heet het Nash-evenwicht (naar John Forbes Nash).

Meer over speltheorie is op het internet te vinden, bijvoorbeeld bij speltheorie.nl, maar als je even zoekt op 'game theory' vind je nog veel engelstalige informatie.

Math4all