Prírodou inšpirované algoritmy

študijné materiály pre projekt mobilnej triedy umelej inteligencie

Späť ku kurzom triedy
Obsah
Úvod
Pravidlá
Stratégie
Evolúcia spolupráce
Tragédia spoločného
Simulácia medzietnickej spolupráce
Reálne prípady
Applety
Linky
O tejto kapitole



Ostatné kapitoly
Freemanove K modely
Umelé imunitné systémy
Biomimicry - Biomimetics
Umelé chémie
Chemické vlny
DNK počítače
Artificial Music
Memetika
Artificial Life Games
Artificial Art
Väzenská dilema


Tutoriály
 Celulárne automaty
 Morfogenéza
 Simulátory
 Evolučné algoritmy
 Chaos
 Roboty
 Rôzne


Pravidlá

Klasická hra

Klasická hra väzenskej dilemy je hrou medzi dvoma hráčmi. Každý hráč má 2 možnosti - "stratégie": spolupracovať s druhým hráčom (cooperate - C), alebo zradiť druhého (defect - D). Obidvaja hráči majú ten istý cieľ: stráviť čo najmenej času za mrežami. Obidvaja hráči majú identické preferenčné poradie možných výsledkov. Obidvaja preferujú výsledok zraď - spolupracuj (0 rokov vo väzení) pred výsledkami spolupracuj - spolupracuj (1 rok), zraď - zraď (10 rokov) a spolupracuj - zraď (20 rokov vo väzení). V teórii hier sa najhorší výsledok (CD) niekedy nazýva "hlupákova výplata" (sucker's payoff). Preferenčné poradie (DC > CC > DD > CD) definuje hru väzenská dilema. Ak hráč zmení toto poradie, hrá inú hru.

protihráč ma zradí protihráč spolupracuje
zradím ho - 5 0
spolupracujem s ním -10 -1
Bodové hodnotenia pri jednotlivých stratégiách-výplatná matica.

Ako sa majú zachovať v tejto situácii Bert a Ernie? Predpokladajme, že Bert počuje, ako Ernie hovorí svojmu advokátovi, že každopádne ostane mlčať - teda bude spolupracovať s Bertom. Čo má Bert robiť? Môže spolupracovať s Erniem a stráviť rok vo väzení alebo ho zradiť a byť prepustený. Ak Ernie spolupracuje, potom najlepšia stratégia pre Berta je zradiť ho. Teraz predpokladajme, že Bert počuje, ako Ernie hovorí svojmu právnikovi, že ho zradí, teda nespolupracuje s ním. Teraz môže Bert buď spolupracovať a dostať 20 rokov, alebo zradí Erniho a dostane 10 rokov. Teda ak Ernie chce zradiť Berta, najlepším riešením pre Berta je zradiť ho.

V jednoťahovej hre, nezávisle od voľby Ernieho, je rozumnou cestou zradiť protihráča. Jazykom teórie hier, zrada je dominantnou stratégiou v hre väzenská dilema (nie každá hra má dominantnú stratégiu). Keďže hra je symetrická, zrada je dominantnou stratégiou pre obidvoch hráčov. Teda rovnovážnym stavom (očakávaným výsledkom) v klasickej hre väzenská dilema je zraď-zraď. Tragédia situácie z pohľadu oboch hráčov je, že výsledok zraď-zraď je kolektívne horší ako spolupracuj-spolupracuj. Teda obidvaja by boli na tom lepšie, ak by spolupracovali. Nanešťastie pre Berta a Ernieho a kohokoľvek iného v podobnej situácii, nie je žiadna tendencia pohybovať sa smerom ku kolektívne najlepšiemu riešeniu.

Túto situáciu nazývame Nashovo equilibrium. Je to stav, ktorý samostatne sa rozhodujúci hráč nemôže zlepšiť zmenou svojej stratégie. Má pre Berta význam zmeniť svoju stratégiu na spoluprácu, ak Bert a Ernie sú v stave zraď-zraď? Nie, lebo tým by jednoducho zdvojnásobil svoj trest z 10 na 20 rokov. Dá sa povedať, že výsledok zraď-zraď je veľmi "stabilný" a túto skutočnosť vyjadruje práve pojem Nashovej rovnováhy.

Iterovaná hra

Nasledujúci príbeh dobre ilustruje iterovanú hru väzenskej dilemy. Dedinka má jednu spoločnú pastvinu, ktorá je dosť veľká, aby uživila všetkých desať kráv. Majitelia pekne bohatnú a časom si môžu dovoliť kúpu novej kravy. Keď sa na lúke ocitne jedenásta krava, nestane sa nič závažné, no každej krave predsa trochu trávy ubudne.

Ak sa však na lúke ocitne 17 kráv, všetky očividne hladujú. Keď si každý farmár kúpi druhú kravu, všetky umrú hladom. Pričom hodnota dvoch kráv, aj keď podvýživených, je stále vyššia, ako hodnota jednej zdravej, takže sa oplatí kúpiť druhú, až do tej chvíle, keď všetky zdochnú.

Klasická väzenská dilema sa hrá raz. Predpokladá súčasnú akciu oboch hráčov bez možnosti ich komunikácie. Keď zrušíme tieto podmienky, nastáva možnosť vzájomnej spolupráce. Množstvo situácií v medzinárodných vzťahoch pripomína práve iterovanú väzenskú dilemu. Prítomnosť iterácie podstatne zmení dynamiku hry. Najväčšou zmenou je, že spolupráca sa stáva rozumnou voľbou. V jednotlivých ťahoch môžeme naďalej získať najviac tým, že zradíme spolupracujúceho oponenta. Keď v prvom kole zradíme oponenta, ktorý spolupracuje, pravdepodobný výsledok bude v nasledujúcich krokoch vzájomná zrada.

Kolo 123456
Stratégia hráča ACDDDDD
Stratégia hráča BDDDDDD
Body hráča A v danom kole -10 0 0 0 0 0
Body hráča B v danom kole 20 0 0 0 0 0
Body hráča A celkovo -10 -10 -10 -10 -10 -10
Body hráča B celkovo 202020202020

Teraz predpokladajme, že obidvaja hráči si uvedomia, že budú hrať znova a znova. Uvedomia si tiež, že kým v jednom kroku výnos DC stratégie ($20) je väčší, než výnos CC stratégie ($5), suma CC výnosov po čase môže byť značný. Nasledujúca tabuľka ilustruje dlhodobý zisk spolupráce.

Kolo 1 2 3 4 5 6
Stratégia hráča A C C C C C C
Stratégia hráča B C C C C C C
Body hráča A v danom kole 10 10 10 10 10 10
Body hráča B v danom kole 10 10 10 10 10 10
Body hráča A celkovo 10 20 30 40 50 60
Body hráča B celkovo 10 20 30 40 50 60

V iterovanej hre sú teda dva rovnovážne stavy. Spolupráca oboch hráčov a zrada oboch hráčov. Z predchádzajúcej tabulky je zrejmé, že z dlhodobého hľadiska je spolupráca oboch príťažlivá aj z čisto sebeckého hľadiska. Túto formu väzenskej dilemy si môžte vyskúšať v interaktívnom applete.

Hore
Kontakt: Marek Bundzel