Add new attachment

Only authorized users are allowed to upload new attachments.

This page (revision-27) was last changed on 12-Jun-2009 14:01 by Jouni Valkonen  

This page was created on 29-Aug-2008 22:31 by JouniValkonen

Only authorized users are allowed to rename pages.

Only authorized users are allowed to delete pages.

Difference between version and

At line 12 changed one line
!!!Keskustelua
[Keskustelu|SuomisarjaKeskustelu]
At line 14 removed 77 lines
Taas suuri päivitys, joka tosin on vielä kesken. Tietokannassa on nyt liki kaikki tasa-avauspelit EGD:stä, mutta huomasin että järjestelmän säätäminen on vaikeampaa kuin oletin. Näin suoria johtopäätöksiä ei vahvuusluvuista voi tehdä. 7 vuoden takaisiin lukuihin verrattuna deflaatio on syönyt noin 500-600 pistettä, mikä ilmenee hyvin vanhojen danien elon kehityksestä joten tämä pitää ottaa huomioon.
Julkaisin uuden version siis pahasti keskeneräisenä, mutta onlinessa kehitystä vain on hiukkasen helpompi tehdä (ja tokihan se lisää työmotivaatiota =). Joten jos joku ei tykkää keskeneräisyyksistä, niin ... jokatapauksessa olen toistaiseksi sorkkinut systeemiä minimaalisesti. Iteroin 90 luvun datasta vain hyvin karkeat lähtöarvot 26 eniten pelanneelle pelaajalla ja kaikki muu siis on systeemin itsensä luomaa.
-- [Jouni|JouniValkonen], 25.5.2009
Nähtävästi ilman monimutkaista algoritmia ei voida deflaatiota korjata koska parametrin oikea arvo riippuu pelaajapopulaation rakenteesta ja suomen oloissa sen pitäisi olla vähintään 0,084, mikä on liian suuri. Vertailuna Gorrin antideflaatioparametri on 0,016 ja sitä sovelletaan valikoidusti. Näin ollen nähdäkseni ainoaksi ratkaisuksi jää tehdä elorappusista dynaamisempi. Siis jos osoittaa 200 pistettä eloaan korkeampaa suoritustasoa, niin systeemi resetoi elon uudelle suoritustasolle. Tämä itsessään jo melkein pystyy pitämään systeemin stabiilina.
Ainakin kun tämän ottaa huomioon, Gor systeemi muuttuu entistäkin mystisemmäksi. Kuinka ihmeessä gorrisysteemi pystyy mitenkään olemaan stabiili? Erityisesti nyt kun ei ole enää matteja "väärin" lähettämässä tuloksia Cieplylle? Tekemässä siis resettitesujeja, antamalla perusteettomia tuplakorotuksia ja lähettämällä tulokset korotetuilla luokituksilla. Ilman muuta gorsysteemi ei voi olla riittävän dynaaminen jotta voisi mitenkään vastata deflaatiolle, erityisesti jos Hikaru no Go näytetään Teemalla.
-- [Jouni|JouniValkonen], 27.5.2009
Ensimmäinen kokeiluversio eloskaalan säädöstä näyttäisi olevan valmis. Tuossa taulukossa on suuripiirteiset Egf luokitusvastaavuudet. Prosentti kertoo millä todennäköisyydellä voittaa yhtä kiveä vahvemman pelaajan. Vertailun vuoksi laitoin mitä oletuksia Gorri käyttää "todennäköisyyksille".
|| Egf || Elo || Erotus || Prosentti || Gorrin %
| 6d | 2450 | | |
| 5d | 2200 | 250 | 19 | 21
| 4d | 2000 | 200 | 24 | 22
| 3d | 1875 | 125 | 33 | 24
| 2d | 1750 | 125 | 33 | 25
| 1d | 1625 | 125 | 33 | 26
| 1k | 1500 | 125 | 33 | 27
| 2k | 1400 | 100 | 36 | 28
| 3k | 1300 | 100 | 36 | 29
| 4k | 1200 | 100 | 36 | 30
| 5k | 1100 | 100 | 36 | 31
-- [Jouni|JouniValkonen], 28.5.2009
Poistin resetin mahdollisuudet yli 2000 pisteen pelaajilta, koska resetin ekstrapolointi ei voi olla luotettavaa tai edes järkevää. 5d ja 6d vastaavuudet ovat tietenkin edelleen vain hyvin karkeita arvauksi.
-- [Jouni|JouniValkonen], 28.5.2009
----
\\
Mietiskelin hiukan __elon ja luokituksen vastaavuuksia__ ja päädyin tuollaiseen taulukkoon. En keksinyt laskennallista tapaa laskea vastaavuuksia gorrin perusteella, joten tyydyin silmämääräiseen arviointiin, joten kyse on varsin karkeasta, mutta toivottavasti suuntaa antavasta arviosta. Kuten pystyy olettamaan 4k heikompiin luokitukseen ei data riitä oikein määrittämään järkevää vertailuarvoa. Yleinen huomio kuitenkin on että hajonta luokituksissa on todella suurta ja erot samalla luokituksella pelaavien välillä saattavat olla helposti parikin kiveä. Tämä suuri hajonta ei ainakaan helpottanut arvioimista. Olisi selkeyttävää jos saisi laskennallisesti verrattua eloa ja gorria.
|| Elo || Egf || Gor%%sup */%
| 2500 | 6d | 2620
| 2350 | 5d | 2554
| 2200 | 4d | 2486
| 2050 | 3d | 2416
| 1900 | 2d | 2344
| 1750 | 1d | 2266
| 1600 | 1k | 2184
| 1500 | 2k | 2128
| 1400 | 3k | 2070
| 1300 | 4-5k | 2012
-- [Jouni|JouniValkonen], 7.4.2009
Oivalsin sitten kuinka gorvastaavuuden voi laskea, mutta parempi olisi varmaan ollut jättää oivaltamatta, koska gorrin skaala on nähtävästi paljon suppeampi kuin osasin arvatakaan. Gorrin(*) laskennassa käytin oletusta, että 2700 olisi sekä elossa ja gorrissa samanarvoisia. Egf:n omat [tilastotkin |http://gemma.ujf.cas.cz/~cieply/GO/statev.html]näyttäisivät poikkeavan melkoisesti gorrin [skaalasta|http://gemma.ujf.cas.cz/~cieply/GO/gormain.html#System] (TableII: SE(100):n arvo pitäisi olla sama kuin tuon tilaston G+1 %-arvo). Näin yhteys luokituksen ja gorrin välillä näyttäisi katoavan likipitäen kokonaan. Eikä oma datanikaan ole sopusoinnussa gorrin kanssa, vaan päinvastoin lähtöarvaukseni tuntuvat olevan luvun 1700 paikkeilla vielä liian löyhällä skaalalla. Toisin sanoen näyttäisi että gorrin oletus lineaarisesta skaalanmuutoksesta on mennyt metsään.
-- [Jouni|JouniValkonen], 8.4.2009
----
Varmaan moni on huomannut niin suomisarja.netissä on ollut käynnissä rakenteellinen uudistus. Nyt suomisarjaan lasketaan sekä turnauspelit että erilliset sarjapelit. Tämän mahdollistaa se että suomisarja.net ylläpitää Suoman varjovahvuuslukulistaa, johon sisällytetään suomalaisten pelaamat turnauspelit sekä suomisarjapelit. Kotimaisissa turnauksissa pelatut pelit ylläpitäjä lisää tietokantaan. Tämä ei tarkoita sitä että kaikki turnauspelit olisivat suomisarjapelejä, vaan suomisarjapelejä ovat vain suomisarjan pelaajien pelaamat turnauspelit.
Pelaajille ei määritetä enää erillistä lähtölukua, vaan serveri arvioi parhaaksi katsomansa alkuluvun ensimmäisten 24 pelin perusteella. Systeemin käynnistämiseksi arvioin vuonna 2007 aktiivisille henkilöille, alkuluvun silloisen luokituksen perusteella siten että shodan sai 1800 pistettä ja siitä sadan pisteen välein alaspäin. Ylöspäin siten että kiinnitin godanin 2400 pisteeseen. Tämän jälkeen tarkastin arvion syöttämällä pelidatan ja jos näytti siltä että luokituksen perusteella tehty arvio osoittautui vääräksi, korjasin lähtölukuarvioita. Näin lähtöluvun arviointi pitäisi perustua mahdollisimman vähän ennakko-oletuksiin ja mahdollisimman paljon pelillisiin ansioihin viimeisen kahden vuoden ajalta.
Koska monen turnauksen tuloksista puuttuu väri-informaatio, on voittaja merkitty listauksissa ensimmäisenä, mutta sikäli kuin väri-informaatio on saatavilla, on musta merkitty lihavoituna. Käppyrätulosteeseen on piirretty neliöin elokäppyrän ohella myös performanssikäppyrä, joka tarkoittaa viimeisen 16 pelin suorituseloa. Jos performanssin ja elon erotus kasvaa riittävän suureksi (n.400 pistettä) serveri arvioi uuden lähtöluvun viimeisten 16 luokitetun pelin perusteella. Kysymysmerkillisiä pelaajia vastaan pelatut pelit eivät ole luokitettuja eivätkä siis vaikuta eloon, joskin vaikuttavat toki performanssiin sitten kun vastuksen kysymysmerkki on kadonnut. Serveri ei myöskään huomioi lähtöluvun arvioinnissa yli vuoden vanhoja pelejä.
Edelleen olisi toivottavaa tarkistaa omien pelien oikeellisuus ainakin silmämääräisesti ja muistinvaraisesti. Vaikka suurin osa tuloksista on haettu koneellisesti 2900+ pelin joukossa on myös käsinsyötettyjä joukossa, joten siellä voi olla puuttuvia pelejä tai muita virheitä.
-- [Jouni|JouniValkonen], 10.3.2009
\\
----
Version Date Modified Size Author Changes ... Change note
27 12-Jun-2009 14:01 0.631 kB Jouni Valkonen to previous
26 31-May-2009 08:54 7.797 kB Jouni Valkonen to previous | to last
25 31-May-2009 08:53 7.797 kB Jouni Valkonen to previous | to last
24 28-May-2009 05:14 7.549 kB Jouni Valkonen to previous | to last
23 28-May-2009 04:47 7.571 kB Jouni Valkonen to previous | to last
22 27-May-2009 15:01 6.835 kB Jouni Valkonen to previous | to last
21 25-May-2009 03:07 5.732 kB Jouni Valkonen to previous | to last Taas uudistuksia
« This page (revision-27) was last changed on 12-Jun-2009 14:01 by Jouni Valkonen