This is version . It is not the current version, and thus it cannot be edited.
[Back to current version]   [Restore this version]

Minusta kehitystyön lähtökohdaksi voisi aivan hyvin ottaa automaatin, joka korottaisi jokaisen pelaajan, jonka tasa-alkuturnaussuoritukset tietyllä luokituksella kuuluisivat vähintään parhaaseen 5 prosenttiin Antti Lehtisen aiemmin tässä keskustelussa julkaiseman algoritmin mukaan. Vastaavasti automaatti alentaisi jokaisen, jonka tasa- alkuturnaustulokset jollakin tietyllä luokituksella kuuluisivat enintään heikoimpaan 5 prosenttiin. Lisäehtona olisi, että maksimitodennäköisyysestimaatti uudelle luokitukselle (tulosten perusteella) olisi riittävän lähellä uutta luokitusta.

Mainittakoon, että korotukseen oikeuttava tulos noilla rajoilla näyttäisi olevan varsin vaikeasti ansaittavissa verrattuna siihen, millaisilla ansioilla nykytilanteessa useimmiten de facto annetaan korotuksia. Tuota automaattia on jo kokeiltu jonkin verran. Taustaoletuksena ovat olleet voittamistodennäköisyydet luokitusten välillä EGF:n voittamistodennäköisyystilastosta, johon olen jo laittanut linkin aiemmin tässä keskustelussa. Lisäksi emme ole olettaneet mitään varjoluokituksia vaan laskeneet todennäköisyydet virallisten luokitusten mukaan. (Jos laskenta hajoaa luokituskomitean mielestä tuohon viimeiseen kohtaan, kuulisin erittäin mielelläni kuinka monen suomalaisen pelaajan "päänahka-arvo" todella poikkeaa heidän virallisista luokituksistaan ja nimenomaan alaspäin. Pelkkä lukumäärä riittää vastaukseksi, henkilökohtainen erittely ei ole tarpeen. Lisäkysymys: kuinka monen päänahka-arvo arvioidaan korkeammaksi kuin heidän virallinen luokituksensa?)

En muuten näe, että GoR-systeemiä kannattaisi ottaa kovinkaan vakavamielisen tilastollisen tarkastelun kohteeksi. Ainakin Suomen osalta GoR on pahasti korruptoitunut, koska suomalaiset luokittajat ovat viimeiset pari-kolme vuotta tehneet voitavansa Suomen GoR-pistepotin maksimoimiseksi sekä antamalla kahden pykälän korotuksia pelaajan pisteiden resetoimiseksi että ilmoittamalla joissakin tapauksissa pelaajan luokituksen turnaustuloksissa väärin systeemin ylläpitäjille. Olen itsekin antanut muutamissa tapauksissa tuplakorotuksen kahden erillisen yhden luokan korotuksen asemesta, jotta Suomen pistepottiin saataisiin lisää pisteitä. Nykyisellään ei ole syytä uskoa GoR:n antavan kuin hyvin karkean arvion pelaajan vahvuudesta, koska resettikorotuksessa tms. siunaantuvien pisteiden osuminen kohdalle on paljolti pelkkää tuuria.)

Mitä mieltä muuten olet Olli siitä, että korotukset pitäisi perustella julkisesti? Mutulla tuo ehdottamani systeemi toimisi edelleenkin valtaosasta korotustapauksia.

-- Markku Jantunen, 11.4. 2003

Mielestäni on melko tervettä että ihmisten luokituksia voi myös alentaa, mikäli joku ei selvästi pysty pelaamaan luokituksensa mukaisella tasolla. Jos ajatellaan luokitukset "arvonimiksi" joita ei voi viedä pois niin sekin on ihan ok, mutta tällöin voisi ottaa käyttöön erillisen "vahvuusluvun" jolla turnauksissa arvioidaan pelaajan taidot ja joka voi muuttua myös alaspäin. Minusta on perin hassua että on olemassa luokitus, jonka mukaan paritetaan ja asetetaan tasoituskivet, mutta silti osa pelaajista arvioidaan eri vahvuiseksi korotuksia päätettäessä.

Olli sanoi että korotuksia annetaan kun joku osoittaa pystyvänsä pelaamaan korotettavan tason mukaista peliä. Tarkoittaako tämä että jos joku on n. 1,1kyu tulosten perusteella niin hänet korotetaan 1 kyuksi vasta kun hän on 1kyu "oikeasti"? Näin ainakin itse ymmärrän tuon. En tiedä onko tämä hyvä vai huono asia, mutta ainakin tämä estää inflaatioautomaatin syntymisen. Toisaalta tästä voi seurata tilanne jossa henkilö pelaa lähes kiven verran paremmin kuin hänen luokituksensa on, jos henkilö on juuri rajalla.

-- Antti Virtanen, 12.4.2003

Toi vahvuus 1,1 Kyu on aika teoreettinen. Ei vahvuuksia voi edes arvioida tuolla tarkuudella. Vaan pelaaja on 1 kyu kun hän on suurinpiirtein sillä tasolla - se, että onko auringontarkka vahvuus 0,9 vai 1,1 ei ole luokittajan tiedossa.

Jollain tilastollisislla AGA/IGS/KGS/ELO/GOR systeemeillä saadaan tietysti desimaaliosien tarkuudella olevia vahvuuslukuja, mutta järjestelmissä oleva pohjakohina on kyllä yli 0,1 kiveä. Ainakin kehittyvät pelaajat aiheuttavat ympäristössään reilusti sitä suuremman kohinan. Lisäksi useimmilla systeemeillä tuntuu olevan deflatorisia taipumuksia. ELO systeemissä siitä on jo ihan tutkimustuloksia, jotka tämän deflatorisen vaikutuksen osoittavat. Ja deflaatio/inflaatio lisäävät myös järjestelmän kohinaa (ilmiö ei etene kaikilla samaa vauhtia)

Pelaajan vahvuus voi vaihdella usemman kiven vireystilan mukaan. Tietysti mitä korkeammista luokituksista on kyse niin sen tarkemmin voidaan arvioida, jos halutaan.

PetriP

Hainkin tässä sitä että korotetaanko pelaaja kun hän tekee jonkin verran parempaa tulosta kuin hänen nykyisen luokituksensa perusteella pitäisi tehdä, vai pitääkö tuloksen olla sellainen, että pelaaja on uuden luokituksensa sisällä n. keskitasoa. Jos siis henkilö on vahva pelaaja (parhaassa viidenneksessä) nykyisen luokituksensa sisällä ja olisi korotettuna heikko pelaaja (heikoimmassa viidenneksessä) uudessa luokituksessaan, koretaanko? Onko tällainen kysymys edes mielekäs - ts. voidaanko sanoa että joku 1 kyu on 1kyuksi luokitettujen vahvimmassa viidenneksessä?

Otin nyt tuon viidenneksen tuohon hatusta, mutta se ei ole oleellista. Miten hyvin pitää pärjätä tulosten perusteella uudella/nykyisellä luokituksella että voidaan korottaa? Tämä kysymys on mielestäni kiinnostava lähinnä siellä luokitusten yläpäässä (1kuy ja siitä ylöspäin) missä kehitystä ei tapahdu kovin nopeasti (tai ollenkaan).

Jos aina lähdetään siitä että pelaajan pitää olla uuden luokituksensa mukaisesti n. keskitasoa ko. luokituksen sisällä tämä on helposti deflatorinen järjestelmä. Parempi sekin kaiketi kuin inflatorinen järjestelmä. Heikoksi 1 daniksi ei ymmärrettävästi haluta korottaa, mielummin annetaan henkilön olla vahva 1kyu.

Jos koko jutun voi kuitata sanomalla "luokituskomitean mutu" niin onhan sekin vastaus.

Antti V

Kuten Petri aiemmin mainitsikin, valitettavasti ei ole olemassa sellaista matemaattista mallia, joka antaisi luotettavia luokitusarvoja. Kaikkien niiden normaali hajonta on selvästi enemmän kuin kolmasosa kivestä, joillain enemmänkin. Tämä siis sen lisäksi että pelaajan taso voi vaihdella jopa joitakin kiviä, olosuhteista riippuen.

Näin ollen matemaattista mallia ei ole käytössä; tyhjästä on paha nyhjäistä. Ikävä kyllä, kukaan wikisijöistäkään ei ole sormeaan heilauttanut siirtyäkseen omasta mutustaan matemaattisen analysoinnin, teoretisoinnin ja mallintamisen suuntaan, joten on kovin vaikea uskoa että mitään kunnon työkalua edes saataisi. Ilmeisesti tuo on niin iso ja vaikea homma, ettei siihen vain pystytä.

Historiallisesti, Suomen luokitukset olivat aikoinaan selvästi heikkoja Eurooppaan nähden, jonka seurauksena on annettu tapahtua hienoista deflaatiota. Nykyään suomalainen luokitus ei enään Euroopassa aiheuta tietäviä hymyjä ja hiljaista hekottelua, joten tätä voi pitää onnistuneena.

Ikävä kyllä, koko Euroopan luokitus "kärsii" hitaasta deflaatiosta, jonka voi arvioida johtuvan siitä, että Euroopan huippu on niin kovaa tasoa. 5 danit eivät korottaudu 6 daneiksi ennen kuin pärjäävät vanhoille, ja sama alempana. Tällä välin vanhatkin vahvistuvat pikku hiljaa, hups. Tämän deflaation eräs ulkomainen, luotettu 6 dan on arvioinut noin kiveksi kymmenessä vuodessa, vaikkakin siinä (näkemykseni mukaan) tuli lyhytaikainen laskuvaihe kun joukko 6 daneja korotettiin 7 daneiksi. Tämäkin sitten kompensoitui kerralla Romanialaisten tullessa ulos kolostaan.

Mainittakoon tässä välissä, että 7 dan on perinteisesti ollut jotain aivan poikkeuksellista; diplomin Nihon Ki-iniltä on saanut WAGC:n voitosta ja suuresta amatöörimenestyksestä kotimaassa (en muista tarkkaan, mutta olikosta se useampi voitto Japanin kansallisissa huipputurnauksissa,) joten onkin ymmärrettävää että pelaajat jotka eivät näissä pärjäisi, ovat epäröineet korotusta 7 daniin.

Nyt tuo poikkeuksellisuus onkin noussut 8 daniin, ja syynä aivan ilmeisesti on, että 7 daneja tuntuu olevan pilvin pimein. Melkoinen ero siihen, että aikoinaan 7 danin diplomin arvioitiin olevan ammattilaistasolla 4 tai 5 danin arvoinen. Tästä huolimatta Eurooppa ei ole inflatoitunut, ja syynä on epäilemättä ollut vahvimpien pelaajien haluttomuus olla pilipalidaneja ulkomaalaisten silmissä.

Suomen luokituskomitean nimetty tehtävä on kuitenkin huolehtia siitä, etteivät kansalliset luokitukset ajelehdi summamutikassa minne sattuu, joten vertailukohdaksi on joka tapauksessa otettava Keski-Eurooppa. Näin ollen deflaatiota on kontrolloitu tutkimalla huolellisesti suomalaisten turnausmenestyksiä eurooppalaisissa turnauksissa, erityisesti EGC:ssä. Tulokset ovat olleet varsin rohkaisevia: Suomi ei ole viime EGC:n perusteella erityisen aliluokitettu, mutta ei millään tavoin selvästi heikkokaan.

Pelaajien korotuksesta, se on aina riippuvainen tasosta jolta/jolle korotetaan. Korkeamman tason korotusten kanssa ollaan aina oltu tarkempia, alemmantasoiset kun eivät yleensä juuri Euroopassa liiku. Itse asiassa melkoisen harvat ovat liikkuneet kotimaassakaan, ehkä viime vuoteen saakka, joten on melkoisen kyseealaista että voiko luokituskomitea paikallisten kerhotulosten perusteella ketään korottaa ilman että homma tulisi hajoamaan.

Turnaustuloksista oppii kohtuullisen nopeasti näkemään kuka pärjäsi hyvin muihin verrattuna. Vastustaja-analyysi (keitä vastaan pärjäsi ja keille hävisi, mikä tasoitus/tasoero) antaa vahvempaa osviittaa siihen että kuka on pelannut tasoansa paremmin. Turnaustulosanalyysi (miten useammassa turnauksessa on käynyt) kertoo että oliko tämä sattumaa vai systemaattista, ja että voiko nyt luotettavasti korottaa.

Ikävä kyllä, suomalaiset turnaukset ovat olleet liki käyttökelvotonta luokitusmateriaalia ylemmille pelaajille, ja ylemmälle keskitasollekin sen jälkeen kun vahvimpien pelaajien kiinnostus osallistumiseen onnistuttiin liki tappamaan, mutta luokituskomitea on silti tehnyt parhaansa.

Perinteisesti,

  • dan-tason korotuksiin on Suomessa aina edellytetty turnausmeriitti, jolla pelaaja osoittaa sekä olevansa tasoa jolle korotetaan että saavuttaneensa henkisesti riittävän tason kestääkseen turnausten paineita. Tämä dan-tasosta riippumatta, mutta ylempien kanssa ollaan tarkempia kuin alempien.
  • ylemmät kyut on korotettu kun huomataan tarve, ja todistusaineisto on riittävä. Tilaisuus on tyypillisesti ollut turnaus, ylempänä mainituista syistä. Todistusaineiston vertailukelpoisuus Euroopan tasoon on tärkeä, joten on turha urputtaa tässä esmes IGS-peleistä joiden vertailukelpoisuus mihinkään, edes itseensä, on heikolla pohjalla.
  • alemmat kyut on delegoitu kerholuokittajille, mutta luokituskomitean jäsenet korottavat aina tarpeen tullen, antaen sitten palautetta kerholuokittajille ("*keles, hoitakaa homma paremmin.") Kaikki luokituskomitean, ohi kerholuokittajien tekemät korotukset tulisikin mieltää moitteeksi kerholuokittajille.

Yhtä kaikki, korotus perustuu arvioon siitä, että pärjäisikö uudella tasolla vai ei, eikä siihen että onko vahvempi kuin nominaalitason muut pelaajat. Jälkimmäinen sisältää inflaatioautomaatin kun kuitenkin turnauksen osallistujat vaihtelevat rajusti, edellisen deflaatioriski kontrolloidaan kansainvälisillä turnausmenestyksillä.

Korotustarvetta arvioitaessa katsotaan kohdetason suhteen

  1. menestystä heikompia vastaan (pitää voittaa selvä valtaosa,)
  2. menestystä samantasoisia (noin puolet) ja
  3. menestystä vahvempia vastaan (ei saa hävitä aivan kaikkia.)

Näistä, käyttäen siis sekä vastustaja- että turnausanalyysiä, arvioidaan että pärjäisikö pelaaja kohdetasolla.

Perusteluna deflaation riskin hyväksymiselle on Euroopan go-pelaajien ja -instituutioiden asennoituminen; olla selvästi nominaalitasoa heikompi pidetään paljon pahana kuin tilapäistä ongelmaa toiseen suuntaan. Tämä taas perustuu siihen, että alentaminen on japanilaisperustaisen ajattelumallin mukaan hyvin vaikeaa, kun taas korotuksia voidaan kyllä antaa.

Näistä syistä kaikille pelaajille on vahvasti suositeltu käymistä kansainvälisissä turnauksissa, etenkin niille jotka haluavat dan-tason korotuksia. Kaikenlainen urputtaminen siitä, kuinka tämä on epäreilua tai ettei se saisi mitään vaikuttaa, on aivan merkityksetöntä sen rinnalla että vertailupiste on kuitenkin ulkomaat eikä kotimaa. Kotimaasta saatu ylätason korotusmeriitti on kuitenkin aina epäluotettavmpi, koska vertailupiste ulkomaihin tulee mutkan kautta eikä suoraan.

Kaikki ylläoleva näkyy koko ajan luokituskomitean toiminnassa, nämä ovat helppoja huomata jos vain malttaa tarkkailla asiaa.

Antti, vastasiko tämä kysymyksiisi?

-- DonOlli, 14.4.

Pitkässä kirjoituksessasi oli onneksi vähän lisää valoitusta luokituskomitean korotusperiaatteista. Kirjoitit:

Korotustarvetta arvioitaessa katsotaan kohdetason suhteen menestystä heikompia vastaan (pitää voittaa selvä valtaosa,) menestystä samantasoisia (noin puolet) ja menestystä vahvempia vastaan (ei saa hävitä aivan kaikkia.)
Otetaanpa nyt esimerkiksi Paavon Pullauttimesta Joosen tasa-avaustulokset viime vuoden alusta lähtien ja tarkasteltavaksi kohdetasoksi 1 dan. Tulokset:
  1. parempia vastaan (2d-5d): 2/8, joka menee ilmeisestikin kategoriaan "ei saa hävitä aivan kaikkia" varsinkin kun pari peliä on 5 dania vastaan.
  2. kohdetaso (1d) 2/4 joka sanojesi mukaan "noin puolet" ja
  3. heikompia vastaan (1k-3k) 6/7 eli "pitää voittaa selvä valtaosa".
Koska Joose olisi pitänyt käsittääkseni korottaa näillä tuloksilla shodaniksi, täytyy ilmeisesti joidenkin Joosen vastustajien olla päänahka-analyysissä (jonka olemassaolo on merkki nykyisen järjestelmän toimimattomuudesta, sillä jos osa pelaajista tunnustetaan luokituskomiteankin puolesta pelaavan väärällä luokituksella, on aika mielenkiintoista kuinka voidaan puhua esim. jostain sm-karsintojen McMahon-ryhmäjaoista tasapuolisena urheiluna) heikompia kuin heidän luokituksensa. Voisitko kertoa, keitä nämä pelaajat ovat?

-- Kari 14.4

Jos lasket noista ulos meikäläisen, Markun ja Gunnarin, onko näyttö annettu? Perusteluna uloslaskentaan on Markun silminnähden väärä luokitus, meikäläisen tuntematon sekä rajusti heilahteleva pelitaso (mm. alennus 3 daniin, jonka alennuksen riittävyys on vielä epävarma) ja Gunnarin osalta etteivät tulokset erityisesti näytä vastaavan 2 dania edes Ruotsissa.

Olisiko sitten parempi jos luokituskomitea väenväkisin alentaa pelaajia vasten heidän tahtoaan, kuin että katsotaan päänahkoja? Alennuksia on kyllä pohdittukin, mutta on toivottu että pelaajat tekisivät sen itse vapaaehtoisesti.

-- DonOlli

Ketään Gunnaria vastaan Joose ei ole pelannut, mutta jos Markku lasketaan 1 dan:na ja sinut 2 danina, on tulos seuraava:

  1. vahvempia vastaan 1/7
  2. shodaneita vastaan 3/5
  3. heikompia vastaan 6/7

-- Kari

Add new attachment

Only authorized users are allowed to upload new attachments.
« This particular version was published on 14-Apr-2003 16:07 by 81.197.68.40.