| Dobásteszt |
|
1. Tétes bábujáték ◊ 2. A dobásteszt hossza ◊ 3. Játékerő ◊ 4. A véletlenhatások csökkentése
A dobásteszt (rollout) az elemzés legprecízebb és legidőigényesebb módja. Olyan helyzetekben vehetjük hasznát, amikor felmerül a gyanúnk, hogy egy állást GNU rosszul ítél meg, akár azért, mert annyira érhetetlennek tűnik számunkra a döntése, akár mert az adott játék komplexitása, időzítésbeli kérdései felvetik, hogy GNU félreérti a helyzetet, ha csak 2-3 lépésmélységig elemzi a játékot. A teljes dobásteszt nem más, mint a GNU játéka önmaga ellen. Egy adott állás dobástesztje azt jelenti, hogy egy előre meghatározott alkalommal a GNU végigjátsza a játékot az utolsó korong leszedéséig. GNU dobásteszten nyújtott játékereje az analízisben leírtak szerint állítható, tehát a dobásteszt során is mindig figyelembe veszi a meccsállást és igény szerint a tétkocka állását is. Ha azonban nagymesteri fokozaton akarnánk -a statisztikailag precíz eredmény érdekében a szükséges 8-10000 alkalommal- lejátszatni egy pozíciót, akkor a feladat még a leggyorsabb gépekkel is kivárhatatlan volna. Szerencsére több trükk is létezik, melyekkel igen rövid időn belül releváns eredményt kapatunk. Nyissuk meg az Settings menü Rollout almenüjét, hogy elvegezhessük a dobásteszt beállításait. A következő ablak ugrik elő.
Az analízis beállításaihoz hasonlóan eldönthetjük, hogy a dobástesztek során GNU vegye-e figyelembe a potenciális kockadöntési helyzeteket is egy-egy válaszlépés kiértékelésénél. Ha szeretnénk alkalmazni az opciót, pipáljuk ki a Cubeful melletti jelölőnégyzetet. A funkció használatának buktatójáról olvashattunk a korábbiakban, ezek a buktatók azonban dobástesztek során szisztematikus hibákká is fajulhatnak. Ezért jól gondoljuk meg, hogy egy adott állás alkalmas-e tétes bábujáték melletti kiértékelésre.
Az első sorban a Trials (próba) felirat mellett beállíthatjuk, hogy hány játékot játsszon végig GNU önmaga ellen. Alaphelyzetben a játék az adott pozícióból elindul, és a fenti beállítások szerint 1296 alkalommal végigjátszásra kerül. Ha a Truncated rollouts (csonkított dobásteszt) melletti jelölőnégyzetre nyomunk, akkor a játékok nem kerülnek végigjátszásra, hanem csak egy meghatározott számú körön át tartanak, mégpedig annyi körön át, melyet a felirattól jobbra lévő tégalapba beírunk. Ha az ábra szerinti 10 ply-os csonkított dobástesztet alkalmazzuk, akkor a tizedik lépés után a játék abbamarad, kiértékelésre kerül, majd megkezdődik a következő dobásteszt. A kiértékelés alaphelyzetben azon elemzési beállítások szerint történik, amelyekkel a GNU a dobásteszt alatt játszott. Amennyiben ettől különböző szintű elemzést szeretnénk, akkor Use player0 setting for truncation point melletti jelölőnégyzetet üresre állítva a Truncation pt. fülön állíthatjuk be az utolsó dobás utáni analízis mélységét. A dobásteszt során kapott eredményeknek statisztikai jellegüknél fogva mindig van egy bizonytalansága. Ennek a bizonytalanságnak a mérőszáma a standard deviáció (szórás), mely arról árulkodik, hogy milyen mértékben térhet el a valós eredmény a kapottól. Egy adott dobásteszt, függően a konkrét állástól, 400 és 1400 lejátszás között többnyire elér egy olyan elfogadható bizonytalanságot (pl. +/- 20 egyenlegpont), melyet már elfogadunk eredményként. Ha a Stop when STDs are small enough melletti jelölőnégyzetet kipipáljuk, akkor a dobásteszt bizonyos számú lejátszás után -Minimum trials- véget érhet, ha a bizonytalanság elég kicsi lett (Ratio). Amennyiben két vagy több dobást akarsz összehasonlítani dobástessztel, az előbbi módon félbehagyható a teszt, ha a két dobás közül az egyikről bebizonyosodik, hogy jobb mint a másik. A Stop Rollouts of multiple moves based on j.s.d. felirat alatti mindkét jelölőnégyzetet aktiválva azt is megtudod, mennyivel jobb az egyik dobás a másiknál. Rövidíthetjük a teszt hosszát a Bearoff Truncation (kiszállási visszanyesés) beállítás használatával is. A „kiszállási visszanyesés” elve azon alapul, hogy a kétoldali kiszállási adatbázis segítségével GNU hiba nélkül meg tudja jósolni a győzelmi esélyek valószínűségét minden no-kontakt helyzetre, amikor mindkét játékos saját otthonában van valamennyi bábujával. A Truncate cubeless (and cubelful money) at exact bearoff database melletti jelölőnégyzetet aktiválva valamennyi tétkocka állás mellett a győzelmi valószínűség pontos értékét kapjuk (feltételezve, hogy hiba nélkül duplázunk). Amennyiben tétnélküli egyenleggel dolgozunk (cubeless), úgy a végigjátszás esetén várható valószínűségeket kapjuk meg.
A játék erősségét a First Play Both fülre kattintva a már megismert módon állíthatjuk be. Alapértelmezés szerint ilyenkor mindkét játékos ezekkel a beállításokkal játssza mind a bábujátékot, mind pedig a tétjátékot. Ha külön akarod definiálni a két GNU játékerejét és eltérő beállításokat szeretnél a bábu- és a kockajátékra, ezt a következőképp teheted meg. A Rollouts ablak General Settings fülére nyomva az ablak alsó harmadában a Cube decisions use same settings as Chequer play felirattól balra elhelyezkedő jelölőnégyzetet állítsd üresre. Ezután a First Play Both fül alatt állíthatóvá válik a Cube decisions hasáb is, ahol beállíthatod a kívánt játékerőt külön a tétdöntések vonatkozásában is. Az előbbi jelölőnégyzet alatt lévő jelölőnégyzetet üresre állítva (Use same settings for both players) a két GNU különböző színvonalra is beállíthatók. Ekkor a fülek jelentései a következőképpen alakulnak: First Play Both: Player0-ra vonatkozó beállítások Előfordulhat, hogy (például egy backgame szituációban) a dobásteszt első néhány lépését fontosnak találod 3 ply mélységen játszani, a későbbiekben azonban megelégednél 0 ply-on játszó, és ezért igen gyors teszttel. Ilyenkor csak be kell jelölnöd az Enable separate evaluation négyzetet, majd a felirattól jobbra lévő téglalapba (Change after ply) beírni, hogy hány lépésen keresztül használja a kezdeti elemzési mélységet. Ha ez megtörtént a fülek jelentései a következőképpen alakulnak: First Play Both: Player0-ra vonatkozó beállítások a dobástesztek első lépéseiben
4. Véletlenhatások csökkentése Ha a GNU nem tudná kiküszöbölni a dobásokból származó véletlenhatásokat, a statisztikailag releváns öt-tízezer dobásteszt elkerülhetetlen lenne ahhoz, hogy elfogadható szórású kiértékeléshez jussunk. Az, hogy 1296 végigjátszás mellett releváns eredményt kapunk, arról a variancia-redukció és a majdnem-véletlen kocka módszerének használata gondoskodik. Ezeket a funkciókat mindig tartsuk bekapcsolva: mindig legyen kipipálva a Variance reduction és a Use quasi-random dice feliratok melletti jelölőnégyzet. A variancia-redukció egy szerencsefaktor-kiküszöbölő eljárás, mely Federik Dahl, a Jelly Fish programozójának a nevéhez fűződik. A szerencsés kombinációk súlyozásával 100 dobásteszt megbízhatósága megegyezik 1000 olyan dobásteszttel ahol az eljárást nem alkalmazták. A majdnem véletlen kocka alapötlete, hogy a dobásteszt legelső dobásai, ellentétben az összes későbbi dobással, nem véletlenszerűek lesznek, hanem minden egymásra következő 36 dobásteszt különböző kombinációval kezdődik majd (1-1, 1-2, 2-1, 3-1 stb, végig mind a 36 kombináció). Hogy ez a technika hozzásegítsen a pontosabb eredményhez, érdemes a 36 valamely többszörösét beállítani a dobástesztek számának (ilyen szám pl. az 1296, ami a 36 négyzete). Ha bejelölöd a Rollout as initial position melletti négyzetet, a majdnem véletlen kockák nem mind a 36 kombinációt, hanem csak azt a 30-at tartalmazzák, melyben nincsen dupla. Így lehetőség van arra, hogy kezdőállásból lehessen dobástesztet végezni.
|