At line 12 changed one line |
!!!Keskustelua |
[Keskustelu|SuomisarjaKeskustelu] |
At line 14 removed 77 lines |
Taas suuri päivitys, joka tosin on vielä kesken. Tietokannassa on nyt liki kaikki tasa-avauspelit EGD:stä, mutta huomasin että järjestelmän säätäminen on vaikeampaa kuin oletin. Näin suoria johtopäätöksiä ei vahvuusluvuista voi tehdä. 7 vuoden takaisiin lukuihin verrattuna deflaatio on syönyt noin 500-600 pistettä, mikä ilmenee hyvin vanhojen danien elon kehityksestä joten tämä pitää ottaa huomioon. |
|
Julkaisin uuden version siis pahasti keskeneräisenä, mutta onlinessa kehitystä vain on hiukkasen helpompi tehdä (ja tokihan se lisää työmotivaatiota =). Joten jos joku ei tykkää keskeneräisyyksistä, niin ... jokatapauksessa olen toistaiseksi sorkkinut systeemiä minimaalisesti. Iteroin 90 luvun datasta vain hyvin karkeat lähtöarvot 26 eniten pelanneelle pelaajalla ja kaikki muu siis on systeemin itsensä luomaa. |
|
-- [Jouni|JouniValkonen], 25.5.2009 |
|
Nähtävästi ilman monimutkaista algoritmia ei voida deflaatiota korjata koska parametrin oikea arvo riippuu pelaajapopulaation rakenteesta ja suomen oloissa sen pitäisi olla vähintään 0,084, mikä on liian suuri. Vertailuna Gorrin antideflaatioparametri on 0,016 ja sitä sovelletaan valikoidusti. Näin ollen nähdäkseni ainoaksi ratkaisuksi jää tehdä elorappusista dynaamisempi. Siis jos osoittaa 200 pistettä eloaan korkeampaa suoritustasoa, niin systeemi resetoi elon uudelle suoritustasolle. Tämä itsessään jo melkein pystyy pitämään systeemin stabiilina. |
|
Ainakin kun tämän ottaa huomioon, Gor systeemi muuttuu entistäkin mystisemmäksi. Kuinka ihmeessä gorrisysteemi pystyy mitenkään olemaan stabiili? Erityisesti nyt kun ei ole enää matteja "väärin" lähettämässä tuloksia Cieplylle? Tekemässä siis resettitesujeja, antamalla perusteettomia tuplakorotuksia ja lähettämällä tulokset korotetuilla luokituksilla. Ilman muuta gorsysteemi ei voi olla riittävän dynaaminen jotta voisi mitenkään vastata deflaatiolle, erityisesti jos Hikaru no Go näytetään Teemalla. |
|
-- [Jouni|JouniValkonen], 27.5.2009 |
|
Ensimmäinen kokeiluversio eloskaalan säädöstä näyttäisi olevan valmis. Tuossa taulukossa on suuripiirteiset Egf luokitusvastaavuudet. Prosentti kertoo millä todennäköisyydellä voittaa yhtä kiveä vahvemman pelaajan. Vertailun vuoksi laitoin mitä oletuksia Gorri käyttää "todennäköisyyksille". |
|
|| Egf || Elo || Erotus || Prosentti || Gorrin % |
| 6d | 2450 | | | |
| 5d | 2200 | 250 | 19 | 21 |
| 4d | 2000 | 200 | 24 | 22 |
| 3d | 1875 | 125 | 33 | 24 |
| 2d | 1750 | 125 | 33 | 25 |
| 1d | 1625 | 125 | 33 | 26 |
| 1k | 1500 | 125 | 33 | 27 |
| 2k | 1400 | 100 | 36 | 28 |
| 3k | 1300 | 100 | 36 | 29 |
| 4k | 1200 | 100 | 36 | 30 |
| 5k | 1100 | 100 | 36 | 31 |
|
|
-- [Jouni|JouniValkonen], 28.5.2009 |
|
Poistin resetin mahdollisuudet yli 2000 pisteen pelaajilta, koska resetin ekstrapolointi ei voi olla luotettavaa tai edes järkevää. 5d ja 6d vastaavuudet ovat tietenkin edelleen vain hyvin karkeita arvauksi. |
|
-- [Jouni|JouniValkonen], 28.5.2009 |
|
---- |
\\ |
Mietiskelin hiukan __elon ja luokituksen vastaavuuksia__ ja päädyin tuollaiseen taulukkoon. En keksinyt laskennallista tapaa laskea vastaavuuksia gorrin perusteella, joten tyydyin silmämääräiseen arviointiin, joten kyse on varsin karkeasta, mutta toivottavasti suuntaa antavasta arviosta. Kuten pystyy olettamaan 4k heikompiin luokitukseen ei data riitä oikein määrittämään järkevää vertailuarvoa. Yleinen huomio kuitenkin on että hajonta luokituksissa on todella suurta ja erot samalla luokituksella pelaavien välillä saattavat olla helposti parikin kiveä. Tämä suuri hajonta ei ainakaan helpottanut arvioimista. Olisi selkeyttävää jos saisi laskennallisesti verrattua eloa ja gorria. |
|
|| Elo || Egf || Gor%%sup */% |
| 2500 | 6d | 2620 |
| 2350 | 5d | 2554 |
| 2200 | 4d | 2486 |
| 2050 | 3d | 2416 |
| 1900 | 2d | 2344 |
| 1750 | 1d | 2266 |
| 1600 | 1k | 2184 |
| 1500 | 2k | 2128 |
| 1400 | 3k | 2070 |
| 1300 | 4-5k | 2012 |
|
-- [Jouni|JouniValkonen], 7.4.2009 |
|
Oivalsin sitten kuinka gorvastaavuuden voi laskea, mutta parempi olisi varmaan ollut jättää oivaltamatta, koska gorrin skaala on nähtävästi paljon suppeampi kuin osasin arvatakaan. Gorrin(*) laskennassa käytin oletusta, että 2700 olisi sekä elossa ja gorrissa samanarvoisia. Egf:n omat [tilastotkin |http://gemma.ujf.cas.cz/~cieply/GO/statev.html]näyttäisivät poikkeavan melkoisesti gorrin [skaalasta|http://gemma.ujf.cas.cz/~cieply/GO/gormain.html#System] (TableII: SE(100):n arvo pitäisi olla sama kuin tuon tilaston G+1 %-arvo). Näin yhteys luokituksen ja gorrin välillä näyttäisi katoavan likipitäen kokonaan. Eikä oma datanikaan ole sopusoinnussa gorrin kanssa, vaan päinvastoin lähtöarvaukseni tuntuvat olevan luvun 1700 paikkeilla vielä liian löyhällä skaalalla. Toisin sanoen näyttäisi että gorrin oletus lineaarisesta skaalanmuutoksesta on mennyt metsään. |
|
-- [Jouni|JouniValkonen], 8.4.2009 |
|
|
|
---- |
|
Varmaan moni on huomannut niin suomisarja.netissä on ollut käynnissä rakenteellinen uudistus. Nyt suomisarjaan lasketaan sekä turnauspelit että erilliset sarjapelit. Tämän mahdollistaa se että suomisarja.net ylläpitää Suoman varjovahvuuslukulistaa, johon sisällytetään suomalaisten pelaamat turnauspelit sekä suomisarjapelit. Kotimaisissa turnauksissa pelatut pelit ylläpitäjä lisää tietokantaan. Tämä ei tarkoita sitä että kaikki turnauspelit olisivat suomisarjapelejä, vaan suomisarjapelejä ovat vain suomisarjan pelaajien pelaamat turnauspelit. |
|
Pelaajille ei määritetä enää erillistä lähtölukua, vaan serveri arvioi parhaaksi katsomansa alkuluvun ensimmäisten 24 pelin perusteella. Systeemin käynnistämiseksi arvioin vuonna 2007 aktiivisille henkilöille, alkuluvun silloisen luokituksen perusteella siten että shodan sai 1800 pistettä ja siitä sadan pisteen välein alaspäin. Ylöspäin siten että kiinnitin godanin 2400 pisteeseen. Tämän jälkeen tarkastin arvion syöttämällä pelidatan ja jos näytti siltä että luokituksen perusteella tehty arvio osoittautui vääräksi, korjasin lähtölukuarvioita. Näin lähtöluvun arviointi pitäisi perustua mahdollisimman vähän ennakko-oletuksiin ja mahdollisimman paljon pelillisiin ansioihin viimeisen kahden vuoden ajalta. |
|
Koska monen turnauksen tuloksista puuttuu väri-informaatio, on voittaja merkitty listauksissa ensimmäisenä, mutta sikäli kuin väri-informaatio on saatavilla, on musta merkitty lihavoituna. Käppyrätulosteeseen on piirretty neliöin elokäppyrän ohella myös performanssikäppyrä, joka tarkoittaa viimeisen 16 pelin suorituseloa. Jos performanssin ja elon erotus kasvaa riittävän suureksi (n.400 pistettä) serveri arvioi uuden lähtöluvun viimeisten 16 luokitetun pelin perusteella. Kysymysmerkillisiä pelaajia vastaan pelatut pelit eivät ole luokitettuja eivätkä siis vaikuta eloon, joskin vaikuttavat toki performanssiin sitten kun vastuksen kysymysmerkki on kadonnut. Serveri ei myöskään huomioi lähtöluvun arvioinnissa yli vuoden vanhoja pelejä. |
|
Edelleen olisi toivottavaa tarkistaa omien pelien oikeellisuus ainakin silmämääräisesti ja muistinvaraisesti. Vaikka suurin osa tuloksista on haettu koneellisesti 2900+ pelin joukossa on myös käsinsyötettyjä joukossa, joten siellä voi olla puuttuvia pelejä tai muita virheitä. |
|
|
-- [Jouni|JouniValkonen], 10.3.2009 |
|
|
\\ |
|
---- |
|
|