de economie

Nash-evenwicht. Speltheorie voor economen (John Nash)

Inhoudsopgave:

Nash-evenwicht. Speltheorie voor economen (John Nash)
Nash-evenwicht. Speltheorie voor economen (John Nash)
Anonim

In de jaren dertig werden John von Neumann en Oscar Morgenstern de grondleggers van een nieuw interessant wiskundig gebied, dat 'speltheorie' werd genoemd. In de jaren vijftig raakte de jonge wiskundige John Nash geïnteresseerd in dit gebied. De evenwichtstheorie werd het onderwerp van zijn proefschrift, dat hij schreef toen hij 21 jaar oud was. Zo ontstond een nieuwe strategie voor games genaamd Nash Equilibrium, die vele jaren later, in 1994, de Nobelprijs verdiende.

Image

De lange kloof tussen het schrijven van een proefschrift en universele acceptatie was een test voor de wiskundige. Genie zonder herkenning resulteerde in ernstige mentale schendingen, maar John Nash wist dit probleem op te lossen dankzij zijn uitstekende logische geest. Zijn theorie van "Nash equilibrium" werd bekroond met de Nobelprijs en zijn verfilming in de film "Beautiful mind" ("Mind Games").

Speltheorie in het kort

Aangezien de theorie van Nash-evenwicht het gedrag van mensen in termen van interactie verklaart, is het daarom de moeite waard om de basisconcepten van de speltheorie te beschouwen.

Speltheorie bestudeert het gedrag van deelnemers (agenten) onder omstandigheden van interactie met elkaar volgens het type spel, wanneer de uitkomst afhangt van de beslissing en het gedrag van meerdere mensen. De deelnemer neemt beslissingen, geleid door zijn voorspellingen met betrekking tot het gedrag van de anderen, de spelstrategie.

Er is ook een dominante strategie waarbij de deelnemer het optimale resultaat krijgt voor elk gedrag van andere deelnemers. Dit is de beste win-winstrategie van de speler.

Gevangendilemma en wetenschappelijke doorbraak

Het dilemma van een gevangene is een geval met een spel waarbij deelnemers gedwongen worden rationele beslissingen te nemen en een gemeenschappelijk doel bereiken in een conflict van alternatieven. De vraag is welke van deze opties hij zal kiezen, waarbij hij zijn persoonlijke en gemeenschappelijke interesse erkent, evenals het onvermogen om beide te krijgen. Spelers lijken te zijn opgesloten in zware spelomstandigheden, waardoor ze soms erg productief denken.

Image

Dit dilemma werd onderzocht door de Amerikaanse wiskundige John Nash. Het evenwicht dat hij naar voren bracht, werd revolutionair in zijn soort. Deze nieuwe gedachte was bijzonder levendig van invloed op de mening van economen over hoe marktspelers keuzes maken, rekening houdend met de belangen van anderen, met nauwe interactie en kruising van belangen.

Het is het beste om speltheorie te bestuderen met specifieke voorbeelden, aangezien deze wiskundige discipline zelf geen droge theoretische is.

Prisoner Dilemma Voorbeeld

Zo zijn twee mensen beroofd, in handen gevallen van de politie en worden verhoord in aparte cellen. Tegelijkertijd bieden politieagenten elke deelnemer gunstige voorwaarden waaronder hij wordt vrijgelaten als hij tegen zijn partner getuigt. Elk van de criminelen heeft de volgende reeks strategieën die hij zal overwegen:

  1. Beiden getuigen en krijgen tegelijkertijd 2, 5 jaar gevangenisstraf.

  2. Beiden zwijgen tegelijkertijd en ontvangen elk 1 jaar, omdat in dit geval de bewijsbasis van hun schuld klein zal zijn.

  3. De een geeft bewijs en krijgt vrijheid, de ander zwijgt en krijgt 5 jaar gevangenisstraf.

De uitkomst van de zaak hangt uiteraard af van de beslissing van beide deelnemers, maar ze kunnen het niet eens worden omdat ze in verschillende cellen zitten. Het conflict tussen hun persoonlijke belangen in de strijd voor een gemeenschappelijk belang is ook duidelijk zichtbaar. Elke gevangene heeft twee opties voor actie en vier opties voor resultaten.

Inferentieketen

Dus crimineel A overweegt de volgende opties:

  1. Ik zwijg en mijn partner zwijgt - we krijgen allebei 1 jaar gevangenisstraf.

  2. Ik geef mijn partner en hij geeft mij - we krijgen allebei 2, 5 jaar gevangenisstraf.

  3. Ik zwijg en mijn partner geeft me over - ik krijg vijf jaar gevangenisstraf en hij zal vrij zijn.

  4. Ik huur mijn partner en hij zwijgt - ik krijg vrijheid en hij zit 5 jaar in de gevangenis.

We geven een matrix van mogelijke oplossingen en resultaten voor de duidelijkheid.

De tabel met waarschijnlijke resultaten van het dilemma van de gevangene.

Image

De vraag is wat elke deelnemer zal kiezen?

"Stilte, je kunt niet praten" of "Stilte, je kunt niet praten"

Om de keuze van de deelnemer te begrijpen, moet je de ketting van zijn gedachten doorlopen. Volgens de redenering van de crimineel A: als ik zwijg en mijn partner zwijg, krijgen we een minimumtermijn (1 jaar), maar ik kan niet achterhalen hoe hij zich zal gedragen. Als hij tegen mij getuigt, is het ook beter voor mij om te getuigen, anders kan ik vijf jaar gaan zitten. Ik zit liever 2, 5 jaar dan 5 jaar. Als hij niets zegt, moet ik des te meer getuigen, want dan krijg ik vrijheid. Lid B betoogt ook op dezelfde manier.

Image

Het is gemakkelijk te begrijpen dat de dominante strategie voor elk van de criminelen is om te getuigen. Het optimale punt van dit spel vindt plaats wanneer beide criminelen getuigen en hun "prijs" ontvangen - 2, 5 jaar gevangenisstraf. De speltheorie van Nash noemt het evenwicht.

Nash Optimale Optimale oplossing

De revolutie van de Nashev-visie is dat zo'n balans niet optimaal is als we kijken naar de individuele deelnemer en zijn persoonlijke interesse. De beste optie is immers om te zwijgen en vrij te gaan.

Nash-evenwicht is een contactpunt, waarbij elke deelnemer alleen een optie kiest die voor hem optimaal is als de andere deelnemers een specifieke strategie kiezen.

Gezien de optie wanneer beide criminelen zwijgen en elk slechts 1 jaar ontvangen, kunnen we het de Pareto-optimale optie noemen. Het is echter alleen mogelijk als de criminelen van tevoren hadden kunnen afspreken. Maar zelfs dit zou deze uitkomst niet garanderen, aangezien de verleiding groot is om terug te gaan van overtuiging en straf te vermijden. Het gebrek aan volledig vertrouwen in elkaar en het gevaar om 5 jaar oud te zijn, dwingt iemand om de optie met erkenning te kiezen. Nadenken over het feit dat deelnemers zich in stilte aan de optie zullen houden, in onderling overleg handelen, is eenvoudigweg irrationeel. Een dergelijke conclusie kan worden getrokken als we het Nash-evenwicht bestuderen. Voorbeelden bewijzen dat alleen.

Egoïstisch of rationeel

De theorie van het Nash-evenwicht heeft verbluffende conclusies opgeleverd en weerlegt de principes die eerder bestonden. Zo beschouwde Adam Smith het gedrag van elk van de deelnemers als absoluut egoïstisch, waardoor het systeem in evenwicht kwam. Deze theorie werd de 'onzichtbare hand van de markt' genoemd.

Image

John Nash zag dat als alle deelnemers hun eigen belangen nastreven, dit nooit tot een optimaal groepsresultaat zal leiden. Aangezien rationeel denken inherent is aan elke deelnemer, is de keuze die de Nash-evenwichtsstrategie biedt waarschijnlijker.

Puur mannelijk experiment

Een levendig voorbeeld is het "blonde paradox" -spel, dat, hoewel het ongepast lijkt, een levendige illustratie is die laat zien hoe de Nash-speltheorie werkt.

In dit spel moet je je voorstellen dat het gezelschap van gratis jongens naar de bar kwam. De volgende is een gezelschap van meisjes, waarvan de ene de voorkeur heeft boven de andere, zeg een blondine. Hoe gedragen jongens zich om de beste vriendin voor zichzelf te krijgen?

Image

Dus, de redenering van de jongens: als iedereen kennis gaat maken met de blondine, dan zal ze hoogstwaarschijnlijk niemand bereiken, dan zullen haar vrienden elkaar niet willen ontmoeten. Niemand wil de tweede fallback zijn. Maar als de jongens ervoor kiezen om de blonde te vermijden, is de kans voor elk van de jongens om een ​​goede vriendin onder de meisjes te vinden groot.

De situatie van Nash-evenwicht is niet optimaal voor jongens, omdat iedereen, die alleen hun egoïstische belangen nastreeft, voor een blondine zou kiezen. Het is duidelijk dat het streven naar alleen egoïstische belangen neerkomt op het ineenstorten van groepsbelangen. Nash-evenwicht betekent dat elke man handelt in zijn eigen persoonlijke belangen, die in contact staan ​​met de belangen van de hele groep. Dit is geen optimale optie voor iedereen persoonlijk, maar optimaal voor iedereen, gebaseerd op de algehele successtrategie.

Ons hele leven is een spel

Beslissingen nemen in reële omstandigheden lijkt veel op een spel wanneer je een bepaald rationeel gedrag van andere deelnemers verwacht. In het bedrijfsleven, op het werk, in een team, in een bedrijf en zelfs in relaties met het andere geslacht. Van grote transacties tot gewone levenssituaties, alles voldoet aan de ene of de andere wet.

Image

Natuurlijk zijn de overwogen spelsituaties met criminelen en de bar slechts uitstekende illustraties die het evenwicht van Nash aantonen. In de reële markt doen zich vaak voorbeelden van dergelijke dilemma's voor, en dit werkt vooral in gevallen met twee monopolisten die de markt beheersen.

Gemengde strategieën

Vaak zijn we niet bij één maar bij meerdere spellen tegelijk betrokken. Het kiezen van een van de opties voor één spel, geleid door een rationele strategie, maar je komt in een ander spel. Na verschillende rationele beslissingen zult u merken dat uw resultaat niet bij u past. Wat moet ik doen?

Overweeg twee soorten strategieën:

  • Een pure strategie is het gedrag van een deelnemer dat voortkomt uit het nadenken over het mogelijke gedrag van andere deelnemers.

  • Een gemengde strategie of een willekeurige strategie is de afwisseling van willekeurige willekeurige strategieën of de keuze voor een pure strategie met een bepaalde waarschijnlijkheid. Deze strategie wordt ook gerandomiseerd genoemd.

Image

Gezien dit gedrag krijgen we een nieuwe kijk op Nash-evenwicht. Als eerder werd gezegd dat de speler één keer een strategie kiest, kan een ander gedrag worden voorgesteld. We kunnen toegeven dat spelers willekeurig een strategie kiezen met een bepaalde waarschijnlijkheid. Games waarin Nash-evenwichten niet in pure strategieën te vinden zijn, hebben ze altijd in gemengde.

Nash-evenwicht in gemengde strategieën wordt gemengd evenwicht genoemd. Dit is zo'n balans, waarbij elke deelnemer de optimale frequentie kiest voor het kiezen van hun strategieën, op voorwaarde dat andere deelnemers hun strategieën kiezen met een bepaalde frequentie.