Keskustelua#
Tietokannassaon nyt koko Euroopan gotietokanta ja elosta on laskettu ensimmäinen luonnosversio. Seuraavaan versioon tulen korjaamaan useita puutteita.
- Tein systeemistä aluksi liian dynaamisen koska pelkäsin deflaatiopeikkoa, mikä oli kuitenkin aiheeton pelko. Tämä aiheutti aika paljon ylimäärästä epävakautta joidenkin pelaajien elokäppyrässä. Deflaatiota ei kuitenkaan tarvitse erityisemmin torjua, koska saksalainen gopopulaatio ei ole kovin altis ole deflaatiolle ja käytän saksalaisia referenssinä, jonka mukaan synkronoin muiden maiden elot. Näin ollen kaikkien muiden maiden elot tarkoittavat aina samaa kuin saksalaisten elot. Tässä versiossa aloitin synkronoinnin vasta vuodesta 2004 joten sillä kohtaa voi olla kummallinen parinsadan pisteen yht’äkkinen hyppäys suomalaisten elokäppyröissä.
- Seuraavaan versioon määritän vielä täsmällisemmät tasoituskivivastaavuudet. Lisäksi kokeillessa tuli muutamia virheitä, puutteita ja tuplasyötteitä, joten ne korjaan myös. Yritän tehdä jonkinlaisen varmistuksen, että ne turnaukset jotka aion syöttää tulee kanssa syötettyä, koska ainakin Leksandin toinen viikko on kadonnut jossain vaiheessa johonkin ja on ilmeistä että siellä saattaa olla muitakin ei niin ilmeisesti havaittavia puutteita.
- Tein käyttöliittymään joitain kiireellisimpiä uudistuksia, mutta uusi tietokantarakenne kaipaa vielä paljon enemmän muutoksia käyttöliittymään. Pelien syöttäminen ei vielä onnistu muutoin kuin sähköpostilla minulle, ja suomisarjapelit ylipäänsä puuttuvat tietokannasta toistaiseksi.
- Ensimmäinen ilmeinen huomio lienee että 200 pistettä per 75 % on hiukan liian lavea skaala goelolle, mutta nähdäkseni kiinteä skaala toimii riittävän hyvin aina purotasolle saakka. Näyttäisi kuitenkin siltä että huippu amatööri goon pelaaja on suunnilleen yhtä vahva kuin maailman vahvimmat shakinpelaajat. Purot puolestaan ovat vielä vahvempia kuin vahvimmat shakkitietokoneet.
- Siemenlukuja en enää edes yrittänyt iteroida koska se on liian työlästä näin heterogeeniselle gopopulaatiolle. Sen sijaan valitsin vuosina 1996-98 yli kymmenen peliä pelanneilta heidän silloiset Egf luokitukset heidän siemenluvuikseen. Muille systeemi määrittää itse alkuluvut.
-- Jouni, 12.6.2009
Taas suuri päivitys, joka tosin on vielä kesken. Tietokannassa on nyt liki kaikki tasa-avauspelit EGD:stä, mutta huomasin että järjestelmän säätäminen on vaikeampaa kuin oletin. Näin suoria johtopäätöksiä ei vahvuusluvuista voi tehdä. 7 vuoden takaisiin lukuihin verrattuna deflaatio on syönyt noin 500-600 pistettä, mikä ilmenee hyvin vanhojen danien elon kehityksestä joten tämä pitää ottaa huomioon.
Julkaisin uuden version siis pahasti keskeneräisenä, mutta onlinessa kehitystä vain on hiukkasen helpompi tehdä (ja tokihan se lisää työmotivaatiota =). Joten jos joku ei tykkää keskeneräisyyksistä, niin ... jokatapauksessa olen toistaiseksi sorkkinut systeemiä minimaalisesti. Iteroin 90 luvun datasta vain hyvin karkeat lähtöarvot 26 eniten pelanneelle pelaajalla ja kaikki muu siis on systeemin itsensä luomaa.
-- Jouni, 25.5.2009
Nähtävästi ilman monimutkaista algoritmia ei voida deflaatiota korjata koska parametrin oikea arvo riippuu pelaajapopulaation rakenteesta ja suomen oloissa sen pitäisi olla vähintään 0,084, mikä on liian suuri. Vertailuna Gorrin antideflaatioparametri on 0,016 ja sitä sovelletaan valikoidusti. Näin ollen nähdäkseni ainoaksi ratkaisuksi jää tehdä elorappusista dynaamisempi. Siis jos osoittaa 200 pistettä eloaan korkeampaa suoritustasoa, niin systeemi resetoi elon uudelle suoritustasolle. Tämä itsessään jo melkein pystyy pitämään systeemin stabiilina.
Ainakin kun tämän ottaa huomioon, Gor systeemi muuttuu entistäkin mystisemmäksi. Kuinka ihmeessä gorrisysteemi pystyy mitenkään olemaan stabiili? Erityisesti nyt kun ei ole enää matteja "väärin" lähettämässä tuloksia Cieplylle? Tekemässä siis resettitesujeja, antamalla perusteettomia tuplakorotuksia ja lähettämällä tulokset korotetuilla luokituksilla. Ilman muuta gorsysteemi ei voi olla riittävän dynaaminen jotta voisi mitenkään vastata deflaatiolle, erityisesti jos Hikaru no Go näytetään Teemalla.
-- Jouni, 27.5.2009
Ensimmäinen kokeiluversio eloskaalan säädöstä näyttäisi olevan valmis. Tuossa taulukossa on suuripiirteiset Egf luokitusvastaavuudet. Prosentti kertoo millä todennäköisyydellä voittaa yhtä kiveä vahvemman pelaajan. Vertailun vuoksi laitoin mitä oletuksia Gorri käyttää "todennäköisyyksille".
Egf | Elo | Erotus | Prosentti | Gorrin % |
---|---|---|---|---|
6d | 2450 | |||
5d | 2200 | 250 | 19 | 21 |
4d | 2000 | 200 | 24 | 22 |
3d | 1875 | 125 | 33 | 24 |
2d | 1750 | 125 | 33 | 25 |
1d | 1625 | 125 | 33 | 26 |
1k | 1500 | 125 | 33 | 27 |
2k | 1400 | 100 | 36 | 28 |
3k | 1300 | 100 | 36 | 29 |
4k | 1200 | 100 | 36 | 30 |
5k | 1100 | 100 | 36 | 31 |
-- Jouni, 28.5.2009
Poistin resetin mahdollisuudet yli 2000 pisteen pelaajilta, koska resetin ekstrapolointi ei voi olla luotettavaa tai edes järkevää. 5d ja 6d vastaavuudet ovat tietenkin edelleen vain hyvin karkeita arvauksi.
-- Jouni, 31.5.2009
Mietiskelin hiukan elon ja luokituksen vastaavuuksia ja päädyin tuollaiseen taulukkoon. En keksinyt laskennallista tapaa laskea vastaavuuksia gorrin perusteella, joten tyydyin silmämääräiseen arviointiin, joten kyse on varsin karkeasta, mutta toivottavasti suuntaa antavasta arviosta. Kuten pystyy olettamaan 4k heikompiin luokitukseen ei data riitä oikein määrittämään järkevää vertailuarvoa. Yleinen huomio kuitenkin on että hajonta luokituksissa on todella suurta ja erot samalla luokituksella pelaavien välillä saattavat olla helposti parikin kiveä. Tämä suuri hajonta ei ainakaan helpottanut arvioimista. Olisi selkeyttävää jos saisi laskennallisesti verrattua eloa ja gorria.
Elo | Egf | Gor* |
---|---|---|
2500 | 6d | 2620 |
2350 | 5d | 2554 |
2200 | 4d | 2486 |
2050 | 3d | 2416 |
1900 | 2d | 2344 |
1750 | 1d | 2266 |
1600 | 1k | 2184 |
1500 | 2k | 2128 |
1400 | 3k | 2070 |
1300 | 4-5k | 2012 |
-- Jouni, 7.4.2009
Oivalsin sitten kuinka gorvastaavuuden voi laskea, mutta parempi olisi varmaan ollut jättää oivaltamatta, koska gorrin skaala on nähtävästi paljon suppeampi kuin osasin arvatakaan. Gorrin(*) laskennassa käytin oletusta, että 2700 olisi sekä elossa ja gorrissa samanarvoisia. Egf:n omat tilastotkinnäyttäisivät poikkeavan melkoisesti gorrin skaalasta (TableII: SE(100):n arvo pitäisi olla sama kuin tuon tilaston G+1 %-arvo). Näin yhteys luokituksen ja gorrin välillä näyttäisi katoavan likipitäen kokonaan. Eikä oma datanikaan ole sopusoinnussa gorrin kanssa, vaan päinvastoin lähtöarvaukseni tuntuvat olevan luvun 1700 paikkeilla vielä liian löyhällä skaalalla. Toisin sanoen näyttäisi että gorrin oletus lineaarisesta skaalanmuutoksesta on mennyt metsään.
-- Jouni, 8.4.2009
Varmaan moni on huomannut niin suomisarja.netissä on ollut käynnissä rakenteellinen uudistus. Nyt suomisarjaan lasketaan sekä turnauspelit että erilliset sarjapelit. Tämän mahdollistaa se että suomisarja.net ylläpitää Suoman varjovahvuuslukulistaa, johon sisällytetään suomalaisten pelaamat turnauspelit sekä suomisarjapelit. Kotimaisissa turnauksissa pelatut pelit ylläpitäjä lisää tietokantaan. Tämä ei tarkoita sitä että kaikki turnauspelit olisivat suomisarjapelejä, vaan suomisarjapelejä ovat vain suomisarjan pelaajien pelaamat turnauspelit.
Pelaajille ei määritetä enää erillistä lähtölukua, vaan serveri arvioi parhaaksi katsomansa alkuluvun ensimmäisten 24 pelin perusteella. Systeemin käynnistämiseksi arvioin vuonna 2007 aktiivisille henkilöille, alkuluvun silloisen luokituksen perusteella siten että shodan sai 1800 pistettä ja siitä sadan pisteen välein alaspäin. Ylöspäin siten että kiinnitin godanin 2400 pisteeseen. Tämän jälkeen tarkastin arvion syöttämällä pelidatan ja jos näytti siltä että luokituksen perusteella tehty arvio osoittautui vääräksi, korjasin lähtölukuarvioita. Näin lähtöluvun arviointi pitäisi perustua mahdollisimman vähän ennakko-oletuksiin ja mahdollisimman paljon pelillisiin ansioihin viimeisen kahden vuoden ajalta.
Koska monen turnauksen tuloksista puuttuu väri-informaatio, on voittaja merkitty listauksissa ensimmäisenä, mutta sikäli kuin väri-informaatio on saatavilla, on musta merkitty lihavoituna. Käppyrätulosteeseen on piirretty neliöin elokäppyrän ohella myös performanssikäppyrä, joka tarkoittaa viimeisen 16 pelin suorituseloa. Jos performanssin ja elon erotus kasvaa riittävän suureksi (n.400 pistettä) serveri arvioi uuden lähtöluvun viimeisten 16 luokitetun pelin perusteella. Kysymysmerkillisiä pelaajia vastaan pelatut pelit eivät ole luokitettuja eivätkä siis vaikuta eloon, joskin vaikuttavat toki performanssiin sitten kun vastuksen kysymysmerkki on kadonnut. Serveri ei myöskään huomioi lähtöluvun arvioinnissa yli vuoden vanhoja pelejä.
Edelleen olisi toivottavaa tarkistaa omien pelien oikeellisuus ainakin silmämääräisesti ja muistinvaraisesti. Vaikka suurin osa tuloksista on haettu koneellisesti 2900+ pelin joukossa on myös käsinsyötettyjä joukossa, joten siellä voi olla puuttuvia pelejä tai muita virheitä.
-- Jouni, 10.3.2009