Prírodou inšpirované algoritmy
študijné materiály pre projekt mobilnej triedy umelej inteligencie
|
|
Prehľad 2D appletov a programov na webe
Applet |
Popis appletu |
|
Applet demonštruje hru populácie, kde sa z istých hráčov stávajú
altruisti, zatiaľ čo iní sa na základe skúseností,
získaných od susedov usilujú o čo najväčšie využitie
informácii pre vlastné víťazstvo.
Aj tu sú takzvaní cooperators, tj. tí čo s políciou
spolupracujú a defectors, čiže zrádzajúci.
Pomocou premennej p si vieme nastaviť počet zrádzajúcich.
Premenná d označuje veľkosť zisku pri zrade v prípade,
že sa protihráč priznal, teda spolupracoval.
To čo vidíme na obrázku po kliknutí na run je postupne
opakujúce sa rozhodovanie hráčov, či sa vzhľadom na vlastný
úspech, ale aj úspešnosť ôsmich susedov oplatí radšej ponechať
zvolenú stratégiu (buď spolupracuj alebo nespolupracuj) alebo je
výhodnejšie ju zmeniť.
Modrou a červenou sú teda vykreslení tí, čo sa v tomto kole
rozhodli rovnako ako v predošlom.
http://www.xs4all.nl/~helfrich/prisoner/
|
|
V tomto programe je zahrnutá aj problematika evolučných algoritmov.
RPD-Repeatetd Prisoner`s Dilemma simuluje opakovanú hru dvoch hráčov
s výplatnou maticou symetrickou pre obe populácie, odkiaľ hráči
pochádzajú, pričom sa môže a nemusí brať do úvahy mutácia a šum.
Každý hráč tu má istú stratégiu reprezentovanú konečným stavovým
automatom, pričom maximum stavov je označené ako S a veľkosť
populácie je daná ako N.
V každej hre hrá každý s každým a úspešní členovia sa reprodukujú
do ďalších generácií, teda do ďalších kôl.
http://www.cs.bris.ac.uk/home/marshall/models/ sipd/
|
|
Toto prevedenie hry dilemy väzňov je vykreslené na mriežke predstavujúcej
stabilný počet hráčov(50).
Každý hráč tu hrá len so sebou a ôsmimi susedmi, mení svoje stanovisko
na základe úspechu či neúspechu pôvodného rozhodnutia.
Výplatná matica je pevne zadaná a to takto:
ak obaja spolupracujú, každý získava 1 bod,
ak obaja nespolupracujú, nikto nezíska nič, teda 0 bodov,
ak jeden nespolupracuje a druhý áno, získava zradca 1.85 bodu a
spolupracujúci tzv. socker ide do väzenia, číže získava 0 bodov V prvej mriežke si myškou vyznačíme
zrádzajúcich, pôvodných spolupracujúcich a
sledujeme, čo sa deje...
Druhá mriežka má okrem nami nainiciovaných zradcov aj 10% náhodne
alokovaných.
http://www.ulster.net/~vjblue/ |
|
Na záver veľmi pekný programček o tom istom...dá sa tu však všeličo ponastavovať,
tak napríklad si môžete vybrať, aké okolie hráča chcete brať do úvahy, dá sa
tiež nastaviť frekvencia spolupráce či počiatočné rozmiestnenie spolupracujúcich hráčov
a zradcov.
http://evolve.lse.ac.uk/compass/ huberman-and-glance-1993/
|
|