Prírodou inšpirované algoritmy

študijné materiály pre projekt mobilnej triedy umelej inteligencie

Späť ku kurzom triedy
Obsah
Úvod
Pravidlá
Stratégie
Evolúcia spolupráce
Tragédia spoločného
Simulácia medzietnickej spolupráce
Reálne prípady
Applety
Linky
O tejto kapitole



Ostatné kapitoly
Freemanove K modely
Umelé imunitné systémy
Biomimicry - Biomimetics
Umelé chémie
Chemické vlny
DNK počítače
Artificial Music
Memetika
Artificial Life Games
Artificial Art
Väzenská dilema


Tutoriály
 Celulárne automaty
 Morfogenéza
 Simulátory
 Evolučné algoritmy
 Chaos
 Roboty
 Rôzne


Simulácia medzietnickej spolupráce

Pre štúdium vzniku spolupráce vo vnútri jednej etnickej skupiny bola použtá obmena evolučnej PD hry. V nej je znalosť histórie ťahov svojich aj ťahov oponentov nahradená penalizáciou. Penalizovaný je agent, ktorý nespolupracoval. Penalizácia sa postupom času znižuje, takže z aktuálnej hodnoty je možné zistiť, ako dlho ešte agent bude penalizovaný. Pre rozhodnutie, či sa agentovi v aktuálnom ťahu penalizácia zvýši alebo nie je však podstatné len to, či je jeho a oponentova penalizácia nulová alebo nie. Na konkrétnu interakciu agentov teda stále majú vplyv predchádzajúce ťahy. Študujme populáciu P, ktorá sa skladá z členov etnickej skupiny A

P = A = {a1, a2, ... , am}

Ako už bolo zmienené, každý agent je špecifikovaný penalizáciou, ktorá je reprezentovaná nezáporným celým číslom

0 ≤ p(a) ≤ pmax

kde nulové p označuje, že agent nie je penalizovnaý, zatiaľ čo kladné p označuje penalizáciu a súčasne časové obdobie, "ako dlho ešte bude daný agent pokladaný za penalizovaného". Pmax je maximálny časový úsek penalizácie. Interakcia medzi dvoma agentmi je plne určená skutočnosťou, či daný agent je alebo nie je penalizovaný a vektormi stratégie. Stratégia agenta a(P) je určená vektorom

s(a) = (s1,s2,s3,s4)x{C,D}4

Význam jednotlivých elementov pre rôzne prípady je určený tabuľkou, kde v prvom stĺpci sú uvedené typy interakcie (C alebo D) hráča a.

ťah P(a)P(b)
s1(a) 0 0
s2(a) 0 >0
s3(a) >0 0
s4(a) >0 >0

Formálne môžeme povedať, že agent aP je reprezentovaný usporiadanou dvojicou vektora stratégie a penalizáciou, pričom interakcia medzi dvoma agentmi aP a bP je plne špecifikovaná ich reprezentáciou.

a = (s, P)

Evolúcia populácie (zloženej z chromozómov ktoré sú špecifikované stratégiou a hodnotou penalizácie) je simulovaná jednoduchou verziou evolučného algoritmu, kde je vynechaná operácia kríženia. Tento algoritmus je založený na proporcionálnom kvázináhodnom výbere stratégií pre reprodukčný proces. Analogicky k biológii hovoríme, že vektor stratégie v špecifikácii agenta odpovedá agentovmu genotypu, zatiaľ čo penalizačná časť odpovedá nadobudnutej vlastnosti, ktorá sa na reprodukcii nepodieľa.

Populácia stratégií je inicializovaná náhodne, pričom každý agent má nulovú penalizáciu. Výsledky simulačných výpočtov (pre veľkosť populácie m = 1000 a maximálne trvanie penalizácie pmax = 10) sú zobrazené na grafe. Emergujúce stratégie odpovedajú schéme (CD##), ktorá

  • kooperuje keď obidvaja agenti nie sú penalizovaní
  • nekooperuje, pokiaľ daný agent nie je penalizovaný, zatiaľ čo druhý agent penalizovaný je
popis obrazku

Víťazné stratégie pripomínajú stratégiu tit-for-tat.

Princíp kolektívnej viny

Princíp kolektívnej viny je založený na predpoklade, že celá etnická skupina je zodpovedná za nespoluprácu jej člena v rámci medzietnických interakcií. Predpokladajme, že populácia P je zložená z dvoch etnických skupín, A a B

P = AUB (A∩B = {})
A = {a1,a2,…,am}, B = {b1,b2,…,bm}

Medzi agentmi populácie P existujú tri typy interakcií:

  • vnútroetnické interakcie v rámci etnickej skupiny A
  • vnútroetnické interakcie v rámci etnickej skupiny B
  • medzietnické interakcie medzi agentmi z A a B

Predpokladajme, že frekvencia medzietnickej interakcie je oveľa menšia ako frekvencia vnútroetnických interakcií. Definuje to pravdepodobnosť Pinter, hodnota ktorej je zadaná ako Pinter = 0.1, teda iba 10% všetkých interakcií má medzietnický charakter. Druhou základnou požiadavkou našich výpočtov je predpoklad tzv. informačnej asymetrie. Predpokladá sa, že agenti môžu identifikovať ostatných agentov z tej istej skupiny a poznajú si navzájom svoju hernú históriu. Na druhej strane, agenti v rámci medzietnických interakcií poznajú iba to, že interagujú s niekým z tej druhej etnickej skupiny, nedokážu rozpoznať individuálnu totožnosť alebo osobnú medzietnickú históriu toho druhého agenta. Nedostatok informácií spôsobuje, že princíp kolektívnej viny je použitý ako riadiace pravidlo pre penalizovanie celej skupiny kvôli medzietnickej nespolupráci.

Nech každý z agentov aA a bB je špecifikovaný penalizáciou z intervalu (0;pmax) a celoetnická penalizácia nech je tiež je braná z tohoto intervalu a bude sa označovať p(A), respektíve p(B). Nedostatok informácie o spoluhráčovi z druhej etnickej skupiny je realizovaný tak, že interagujúci agenti poznajú, či je etnická skupina ich oponentov penalizovaná.

Špecifikujme ďalšie štyri prvky vektora stratégie, konkrétne pre agenta aA :

reakcia p(A)p(B)
s5(a)0 0
s6(a)0 >0
s7(a)0 0
s8(a)>0 >0

Stratégia agenta aA je opísaná vektorom

s(a) = (s1,s2,…,s8)x{C,D}8

kde prvé štyri prvky určujú vnútroetnickú interakciu, ďalšie štyri určujú medzietnickú spoluprácu. Evolúcia populácie je robená nezávisle pre obidve etnické skupiny, ktoré interagujú iba vtedy, keď je treba vypočítať fitnes agentov, kde časť bodového ohodnotenia je určená medzietnickými interakciami.

Z výsledkov simulačných výpočtov sa dá usúdiť, že evolúcia stratégií, ktoré sú založené na princípe kolektívnej viny, neprodukuje evolučne stabilnú stratégiu, ktorá by mala zabudovanú spoluprácu medzi agentmi z rozdielnych etnických skupín, ktoré nie sú penalizované. Aj keď výsledná evolučne stabilná stratégia je spolupracujúca v rámci vnútroetnických interakcií dvoch nepenalizovaných agentov, agenti z rozdielnych skupín nespolupracujú, ani keď sú obidve skupiny momentálne nepenalizované.

Princíp kolektívnej viny s administrátorom

Modifikácia princípu kolektívnej viny zavedením administrátora je schopný zabezpečiť medzietnickú spoluprácu v modeli založenom na princípe kolektívnej viny. Administrátor trestá stochasticky pokutou agentov, ktorí nekooperujú v rámci medzietnických interakcií (keď obidve etnické skupiny nie sú penalizované). Podľa predpokladov o informačnej asymetrii je rozumné predpokladať, že administrátor nepozná detailné informácie o práve interagujúcich agentoch z rozdielnych etnických skupín. Ak agent aA nespolupracuje s agentom bB, administrátor v štýle deus ex machina stochasticky penalizuje nekooperáciu v medzietnickej interakcii, pričom obidve skupiny sú v nepenalizovanom stave a druhý agent spolupracuje.

Výsledky ukazujú, že pri pravdepodobnosti pokuty 50% sa objavuje kooperácia. Pravdepodobnosť penalizácie má hraničnú hodnotu, pod ktorou medzietnická kooperácia nenastáva.

Princíp osobnej zodpovednosti

Aplikácia princípu kolektívnej viny nevedie k medzietnickej spolupráci, dokonca niekedy spôsobuje rozpad vnútroetnickej spolupráce. Zamenením princípu kolektívnej zmeny za princíp osobnej zodpovednosti agenti, ktorí nekooperujú v rámci medzietnických vzťahov, budú potrestaní v rámci svojej vlastnej skupiny. Agenti inej skupiny môžu penalizovať druhého agenta, ale sami sú schopní rozpoznať penalizáciu iba u agenta z rovnakej etnickej skupiny. Agenti v rámci jednej skupiny medzi sebou nerozlišujú, či je druhý agent penalizovaný, čiže nespolupracoval s agentom z tej istej, alebo z inej etnickej skupiny.

Špecifikácia posledných dvoch prvkov vektora stratégie vizerá takto:

reakcia P(A)
s5(a) 0
s6(a) >0

Stratégia agenta aA je popísaná vektorom

s(a) = (s1, s2, ... , s6)x{C,D}6

Pri aplikovaní princípu osobnej zodpovednosti vznikajú dva typy evolučne stabilných stratégií. Prvá je absolútne nekooperujúca stratégia s=(DDDDDD), ktorej oblasť príťažlivosti závisí na maximálnom trvaní penalizácie pmax (čím je väčšia, tým je menšia oblasť príťažlivosti). Pre dostatočne veľkú hodnotu pmax sa stávajú evolučne stabilnými stratégie odpovedajúce kooperujúcej schéme s=(C###CD).

Hore
Kontakt: Marek Bundzel