This is version . It is not the current version, and thus it cannot be edited.
[Back to current version]   [Restore this version]

Minusta kehitystyön lähtökohdaksi voisi aivan hyvin ottaa automaatin, joka korottaisi jokaisen pelaajan, jonka tasa-alkuturnaussuoritukset tietyllä luokituksella kuuluisivat vähintään parhaaseen 5 prosenttiin Antti Lehtisen aiemmin tässä keskustelussa julkaiseman algoritmin mukaan. Vastaavasti automaatti alentaisi jokaisen, jonka tasa- alkuturnaustulokset jollakin tietyllä luokituksella kuuluisivat enintään heikoimpaan 5 prosenttiin. Lisäehtona olisi, että maksimitodennäköisyysestimaatti uudelle luokitukselle (tulosten perusteella) olisi riittävän lähellä uutta luokitusta.

Mainittakoon, että korotukseen oikeuttava tulos noilla rajoilla näyttäisi olevan varsin vaikeasti ansaittavissa verrattuna siihen, millaisilla ansioilla nykytilanteessa useimmiten de facto annetaan korotuksia. Tuota automaattia on jo kokeiltu jonkin verran. Taustaoletuksena ovat olleet voittamistodennäköisyydet luokitusten välillä EGF:n voittamistodennäköisyystilastosta, johon olen jo laittanut linkin aiemmin tässä keskustelussa. Lisäksi emme ole olettaneet mitään varjoluokituksia vaan laskeneet todennäköisyydet virallisten luokitusten mukaan. (Jos laskenta hajoaa luokituskomitean mielestä tuohon viimeiseen kohtaan, kuulisin erittäin mielelläni kuinka monen suomalaisen pelaajan "päänahka-arvo" todella poikkeaa heidän virallisista luokituksistaan ja nimenomaan alaspäin. Pelkkä lukumäärä riittää vastaukseksi, henkilökohtainen erittely ei ole tarpeen. Lisäkysymys: kuinka monen päänahka-arvo arvioidaan korkeammaksi kuin heidän virallinen luokituksensa?)

En muuten näe, että GoR-systeemiä kannattaisi ottaa kovinkaan vakavamielisen tilastollisen tarkastelun kohteeksi. Ainakin Suomen osalta GoR on pahasti korruptoitunut, koska suomalaiset luokittajat ovat viimeiset pari-kolme vuotta tehneet voitavansa Suomen GoR-pistepotin maksimoimiseksi sekä antamalla kahden pykälän korotuksia pelaajan pisteiden resetoimiseksi että ilmoittamalla joissakin tapauksissa pelaajan luokituksen turnaustuloksissa väärin systeemin ylläpitäjille. Olen itsekin antanut muutamissa tapauksissa tuplakorotuksen kahden erillisen yhden luokan korotuksen asemesta, jotta Suomen pistepottiin saataisiin lisää pisteitä. Nykyisellään ei ole syytä uskoa GoR:n antavan kuin hyvin karkean arvion pelaajan vahvuudesta, koska resettikorotuksessa tms. siunaantuvien pisteiden osuminen kohdalle on paljolti pelkkää tuuria.)

Mitä mieltä muuten olet Olli siitä, että korotukset pitäisi perustella julkisesti? Mutulla tuo ehdottamani systeemi toimisi edelleenkin valtaosasta korotustapauksia.

-- Markku Jantunen, 11.4. 2003

Mielestäni on melko tervettä että ihmisten luokituksia voi myös alentaa, mikäli joku ei selvästi pysty pelaamaan luokituksensa mukaisella tasolla. Jos ajatellaan luokitukset "arvonimiksi" joita ei voi viedä pois niin sekin on ihan ok, mutta tällöin voisi ottaa käyttöön erillisen "vahvuusluvun" jolla turnauksissa arvioidaan pelaajan taidot ja joka voi muuttua myös alaspäin. Minusta on perin hassua että on olemassa luokitus, jonka mukaan paritetaan ja asetetaan tasoituskivet, mutta silti osa pelaajista arvioidaan eri vahvuiseksi korotuksia päätettäessä.

Olli sanoi että korotuksia annetaan kun joku osoittaa pystyvänsä pelaamaan korotettavan tason mukaista peliä. Tarkoittaako tämä että jos joku on n. 1,1kyu tulosten perusteella niin hänet korotetaan 1 kyuksi vasta kun hän on 1kyu "oikeasti"? Näin ainakin itse ymmärrän tuon. En tiedä onko tämä hyvä vai huono asia, mutta ainakin tämä estää inflaatioautomaatin syntymisen. Toisaalta tästä voi seurata tilanne jossa henkilö pelaa lähes kiven verran paremmin kuin hänen luokituksensa on, jos henkilö on juuri rajalla.

-- Antti Virtanen, 12.4.2003

Toi vahvuus 1,1 Kyu on aika teoreettinen. Ei vahvuuksia voi edes arvioida tuolla tarkuudella. Vaan pelaaja on 1 kyu kun hän on suurinpiirtein sillä tasolla - se, että onko auringontarkka vahvuus 0,9 vai 1,1 ei ole luokittajan tiedossa.

Jollain tilastollisislla AGA/IGS/KGS/ELO/GOR systeemeillä saadaan tietysti desimaaliosien tarkuudella olevia vahvuuslukuja, mutta järjestelmissä oleva pohjakohina on kyllä yli 0,1 kiveä. Ainakin kehittyvät pelaajat aiheuttavat ympäristössään reilusti sitä suuremman kohinan. Lisäksi useimmilla systeemeillä tuntuu olevan deflatorisia taipumuksia. ELO systeemissä siitä on jo ihan tutkimustuloksia, jotka tämän deflatorisen vaikutuksen osoittavat. Ja deflaatio/inflaatio lisäävät myös järjestelmän kohinaa (ilmiö ei etene kaikilla samaa vauhtia)

Pelaajan vahvuus voi vaihdella usemman kiven vireystilan mukaan. Tietysti mitä korkeammista luokituksista on kyse niin sen tarkemmin voidaan arvioida, jos halutaan.

PetriP

Hainkin tässä sitä että korotetaanko pelaaja kun hän tekee jonkin verran parempaa tulosta kuin hänen nykyisen luokituksensa perusteella pitäisi tehdä, vai pitääkö tuloksen olla sellainen, että pelaaja on uuden luokituksensa sisällä n. keskitasoa. Jos siis henkilö on vahva pelaaja (parhaassa viidenneksessä) nykyisen luokituksensa sisällä ja olisi korotettuna heikko pelaaja (heikoimmassa viidenneksessä) uudessa luokituksessaan, koretaanko? Onko tällainen kysymys edes mielekäs - ts. voidaanko sanoa että joku 1 kyu on 1kyuksi luokitettujen vahvimmassa viidenneksessä?

Otin nyt tuon viidenneksen tuohon hatusta, mutta se ei ole oleellista. Miten hyvin pitää pärjätä tulosten perusteella uudella/nykyisellä luokituksella että voidaan korottaa? Tämä kysymys on mielestäni kiinnostava lähinnä siellä luokitusten yläpäässä (1kuy ja siitä ylöspäin) missä kehitystä ei tapahdu kovin nopeasti (tai ollenkaan).

Jos aina lähdetään siitä että pelaajan pitää olla uuden luokituksensa mukaisesti n. keskitasoa ko. luokituksen sisällä tämä on helposti deflatorinen järjestelmä. Parempi sekin kaiketi kuin inflatorinen järjestelmä. Heikoksi 1 daniksi ei ymmärrettävästi haluta korottaa, mielummin annetaan henkilön olla vahva 1kyu.

Jos koko jutun voi kuitata sanomalla "luokituskomitean mutu" niin onhan sekin vastaus.

Antti V

Kuten Petri aiemmin mainitsikin, valitettavasti ei ole olemassa sellaista matemaattista mallia, joka antaisi luotettavia luokitusarvoja. Kaikkien niiden normaali hajonta on selvästi enemmän kuin kolmasosa kivestä, joillain enemmänkin. Tämä siis sen lisäksi että pelaajan taso voi vaihdella jopa joitakin kiviä, olosuhteista riippuen.

Näin ollen matemaattista mallia ei ole käytössä; tyhjästä on paha nyhjäistä. Ikävä kyllä, kukaan wikisijöistäkään ei ole sormeaan heilauttanut siirtyäkseen omasta mutustaan matemaattisen analysoinnin, teoretisoinnin ja mallintamisen suuntaan, joten on kovin vaikea uskoa että mitään kunnon työkalua edes saataisi. Ilmeisesti tuo on niin iso ja vaikea homma, ettei siihen vain pystytä.

Historiallisesti, Suomen luokitukset olivat aikoinaan selvästi heikkoja Eurooppaan nähden, jonka seurauksena on annettu tapahtua hienoista deflaatiota. Nykyään suomalainen luokitus ei enään Euroopassa aiheuta tietäviä hymyjä ja hiljaista hekottelua, joten tätä voi pitää onnistuneena.

Ikävä kyllä, koko Euroopan luokitus "kärsii" hitaasta deflaatiosta, jonka voi arvioida johtuvan siitä, että Euroopan huippu on niin kovaa tasoa. 5 danit eivät korottaudu 6 daneiksi ennen kuin pärjäävät vanhoille, ja sama alempana. Tällä välin vanhatkin vahvistuvat pikku hiljaa, hups. Tämän deflaation eräs ulkomainen, luotettu 6 dan on arvioinut noin kiveksi kymmenessä vuodessa, vaikkakin siinä (näkemykseni mukaan) tuli lyhytaikainen laskuvaihe kun joukko 6 daneja korotettiin 7 daneiksi. Tämäkin sitten kompensoitui kerralla Romanialaisten tullessa ulos kolostaan.

Mainittakoon tässä välissä, että 7 dan on perinteisesti ollut jotain aivan poikkeuksellista; diplomin Nihon Ki-iniltä on saanut WAGC:n voitosta ja suuresta amatöörimenestyksestä kotimaassa (en muista tarkkaan, mutta olikosta se useampi voitto Japanin kansallisissa huipputurnauksissa,) joten onkin ymmärrettävää että pelaajat jotka eivät näissä pärjäisi, ovat epäröineet korotusta 7 daniin.

Nyt tuo poikkeuksellisuus onkin noussut 8 daniin, ja syynä aivan ilmeisesti on, että 7 daneja tuntuu olevan pilvin pimein. Melkoinen ero siihen, että aikoinaan 7 danin diplomin arvioitiin olevan ammattilaistasolla 4 tai 5 danin arvoinen. Tästä huolimatta Eurooppa ei ole inflatoitunut, ja syynä on epäilemättä ollut vahvimpien pelaajien haluttomuus olla pilipalidaneja ulkomaalaisten silmissä.

Suomen luokituskomitean nimetty tehtävä on kuitenkin huolehtia siitä, etteivät kansalliset luokitukset ajelehdi summamutikassa minne sattuu, joten vertailukohdaksi on joka tapauksessa otettava Keski-Eurooppa. Näin ollen deflaatiota on kontrolloitu tutkimalla huolellisesti suomalaisten turnausmenestyksiä eurooppalaisissa turnauksissa, erityisesti EGC:ssä. Tulokset ovat olleet varsin rohkaisevia: Suomi ei ole viime EGC:n perusteella erityisen aliluokitettu, mutta ei millään tavoin selvästi heikkokaan.

Pelaajien korotuksesta, se on aina riippuvainen tasosta jolta/jolle korotetaan. Korkeamman tason korotusten kanssa ollaan aina oltu tarkempia, alemmantasoiset kun eivät yleensä juuri Euroopassa liiku. Itse asiassa melkoisen harvat ovat liikkuneet kotimaassakaan, ehkä viime vuoteen saakka, joten on melkoisen kyseealaista että voiko luokituskomitea paikallisten kerhotulosten perusteella ketään korottaa ilman että homma tulisi hajoamaan.

Turnaustuloksista oppii kohtuullisen nopeasti näkemään kuka pärjäsi hyvin muihin verrattuna. Vastustaja-analyysi (keitä vastaan pärjäsi ja keille hävisi, mikä tasoitus/tasoero) antaa vahvempaa osviittaa siihen että kuka on pelannut tasoansa paremmin. Turnaustulosanalyysi (miten useammassa turnauksessa on käynyt) kertoo että oliko tämä sattumaa vai systemaattista, ja että voiko nyt luotettavasti korottaa.

Ikävä kyllä, suomalaiset turnaukset ovat olleet liki käyttökelvotonta luokitusmateriaalia ylemmille pelaajille, ja ylemmälle keskitasollekin sen jälkeen kun vahvimpien pelaajien kiinnostus osallistumiseen onnistuttiin liki tappamaan, mutta luokituskomitea on silti tehnyt parhaansa.

Perinteisesti,

  • dan-tason korotuksiin on Suomessa aina edellytetty turnausmeriitti, jolla pelaaja osoittaa sekä olevansa tasoa jolle korotetaan että saavuttaneensa henkisesti riittävän tason kestääkseen turnausten paineita. Tämä dan-tasosta riippumatta, mutta ylempien kanssa ollaan tarkempia kuin alempien.
  • ylemmät kyut on korotettu kun huomataan tarve, ja todistusaineisto on riittävä. Tilaisuus on tyypillisesti ollut turnaus, ylempänä mainituista syistä. Todistusaineiston vertailukelpoisuus Euroopan tasoon on tärkeä, joten on turha urputtaa tässä esmes IGS-peleistä joiden vertailukelpoisuus mihinkään, edes itseensä, on heikolla pohjalla.
  • alemmat kyut on delegoitu kerholuokittajille, mutta luokituskomitean jäsenet korottavat aina tarpeen tullen, antaen sitten palautetta kerholuokittajille ("*keles, hoitakaa homma paremmin.") Kaikki luokituskomitean, ohi kerholuokittajien tekemät korotukset tulisikin mieltää moitteeksi kerholuokittajille.

Yhtä kaikki, korotus perustuu arvioon siitä, että pärjäisikö uudella tasolla vai ei, eikä siihen että onko vahvempi kuin nominaalitason muut pelaajat. Jälkimmäinen sisältää inflaatioautomaatin kun kuitenkin turnauksen osallistujat vaihtelevat rajusti, edellisen deflaatioriski kontrolloidaan kansainvälisillä turnausmenestyksillä.

Korotustarvetta arvioitaessa katsotaan kohdetason suhteen

  1. menestystä heikompia vastaan (pitää voittaa selvä valtaosa,)
  2. menestystä samantasoisia (noin puolet) ja
  3. menestystä vahvempia vastaan (ei saa hävitä aivan kaikkia.)

Näistä, käyttäen siis sekä vastustaja- että turnausanalyysiä, arvioidaan että pärjäisikö pelaaja kohdetasolla.

Perusteluna deflaation riskin hyväksymiselle on Euroopan go-pelaajien ja -instituutioiden asennoituminen; olla selvästi nominaalitasoa heikompi pidetään paljon pahana kuin tilapäistä ongelmaa toiseen suuntaan. Tämä taas perustuu siihen, että alentaminen on japanilaisperustaisen ajattelumallin mukaan hyvin vaikeaa, kun taas korotuksia voidaan kyllä antaa.

Näistä syistä kaikille pelaajille on vahvasti suositeltu käymistä kansainvälisissä turnauksissa, etenkin niille jotka haluavat dan-tason korotuksia. Kaikenlainen urputtaminen siitä, kuinka tämä on epäreilua tai ettei se saisi mitään vaikuttaa, on aivan merkityksetöntä sen rinnalla että vertailupiste on kuitenkin ulkomaat eikä kotimaa. Kotimaasta saatu ylätason korotusmeriitti on kuitenkin aina epäluotettavmpi, koska vertailupiste ulkomaihin tulee mutkan kautta eikä suoraan.

Kaikki ylläoleva näkyy koko ajan luokituskomitean toiminnassa, nämä ovat helppoja huomata jos vain malttaa tarkkailla asiaa.

Antti, vastasiko tämä kysymyksiisi?

-- DonOlli, 14.4.

Pitkässä kirjoituksessasi oli onneksi vähän lisää valoitusta luokituskomitean korotusperiaatteista. Kirjoitit:

Korotustarvetta arvioitaessa katsotaan kohdetason suhteen menestystä heikompia vastaan (pitää voittaa selvä valtaosa,) menestystä samantasoisia (noin puolet) ja menestystä vahvempia vastaan (ei saa hävitä aivan kaikkia.)
Otetaanpa nyt esimerkiksi Paavon Pullauttimesta Joosen tasa-avaustulokset viime vuoden alusta lähtien ja tarkasteltavaksi kohdetasoksi 1 dan. Tulokset:
  1. parempia vastaan (2d-5d): 2/8, joka menee ilmeisestikin kategoriaan "ei saa hävitä aivan kaikkia" varsinkin kun pari peliä on 5 dania vastaan.
  2. kohdetaso (1d) 2/4 joka sanojesi mukaan "noin puolet" ja
  3. heikompia vastaan (1k-3k) 6/7 eli "pitää voittaa selvä valtaosa".
Koska Joose olisi pitänyt käsittääkseni korottaa näillä tuloksilla shodaniksi, täytyy ilmeisesti joidenkin Joosen vastustajien olla päänahka-analyysissä (jonka olemassaolo on merkki nykyisen järjestelmän toimimattomuudesta, sillä jos osa pelaajista tunnustetaan luokituskomiteankin puolesta pelaavan väärällä luokituksella, on aika mielenkiintoista kuinka voidaan puhua esim. jostain sm-karsintojen McMahon-ryhmäjaoista tasapuolisena urheiluna) heikompia kuin heidän luokituksensa. Voisitko kertoa, keitä nämä pelaajat ovat?

-- Kari 14.4

Jos lasket noista ulos meikäläisen, Markun ja Gunnarin, onko näyttö annettu? Perusteluna uloslaskentaan on Markun silminnähden väärä luokitus, meikäläisen tuntematon sekä rajusti heilahteleva pelitaso (mm. alennus 3 daniin, jonka alennuksen riittävyys on vielä epävarma) ja Gunnarin osalta etteivät tulokset erityisesti näytä vastaavan 2 dania edes Ruotsissa.

Olisiko sitten parempi jos luokituskomitea väenväkisin alentaa pelaajia vasten heidän tahtoaan, kuin että katsotaan päänahkoja? Alennuksia on kyllä pohdittukin, mutta on toivottu että pelaajat tekisivät sen itse vapaaehtoisesti.

-- DonOlli

Ketään Gunnaria vastaan Joose ei ole pelannut, mutta jos Markku lasketaan 1 dan ja sinut 2 dan, on tulos seuraava:

  1. vahvempia vastaan 1/7
  2. shodaneita vastaan 3/5
  3. heikompia vastaan 6/7

-- Kari

Nyt olet sortumassa siihen mistä toisia moitit: olettamaan liikoja historiatietojen perusteella. Markku ei tunnu pärjäävän edes 1 danina ilman selittelyä, ja oma tasoni turnauspeleissä (sic!) on täysin tuntematon ennen kuin saadaan lisätietoa. Näin niiden laskeminen mukaan ollenkaan on varsin kyseenalaista.

Ollaan siis joka tapauksessa odottamassa PM:n tuloksia, siitä saanee lisätietoa. Ja hups, von Arnold onkin Gunnarin veli Dag, joka on jo alentanut itsensä takaisin 1 kyuksi. Hmm...

Mutta ilmeisesti ajatus pelaajien väkisin alentamisesta on se mitä halutaan, eli pitänee ottaa asia esille luokituskomiteassa.

-- DonOlli

Dag von Arnold pelasi Jusan Danissa 1 kyuna. Jos pitää paikkansa, että hän on joskus pelannut vahvemmalla luokituksella ei liittyne asiaan. Mitä minun pärjäämiseeni 1 danina tulee, en kommentoi asiaa itse. Alla yhteenveto tuloksistani tasa-avaus turnauksissa vuoden 2002 alusta laskien. (Vuoden 2001 pidin taukoa turnaustoiminnasta). Kaksi 2 danin luokituksella minua vastaan pelanneista on laskettu 1 kyuksi (yksi kotimainen pelaaja ja yksi japanilainen). Jaakko Munkki -turnauksessa 2003 tasoituksin 1 danina tulos 2/6, joka tuskin lienee normaalijakauman virherajojen ulkopuolella tai lähelläkään niitä.

3d 0.00% (0/1)
2d 20.00% (2/10)
1d 40.00% (4/10)
1k 77.78% (7/9)
2k 50.00% (1/2)
4k 100.00% (1/1)
9k 100.00% (1/1)

Tulkinnat jätän muille.

Alla viitteenä kaikki pelit tasoitusturnauksista 1 danina ja 2 danina ilman mahdollisten varjoluokitusten huomioonottamista.

5d 0.00% (0/9)
4d 20.00% (1/5)
3d 44.44% (4/9)
2d 52.94% (9/17)
1d 47.06% (8/17)
1k 62.50% (15/24)
2k 71.43% (5/7)
3k 100.00% (6/6)
4k 100.00% (3/3)
5k 100.00% (3/3)
6k 100.00% (2/2)
9k 100.00% (1/1)
12k 100.00% (1/1)

Tasoituspelit 2 danina vuoden 2002 aikana: 13/26. Alitasoitusvoitot poistettuna 10/26.

-- Markku Jantunen, 16.4. 2003

Sain vastauksen kysymyksiini (olli tuolla aiemmin kyseli tätä).

--Antti

Väkisinalentaminen on samalla muiden ylentämistä, eli periaatteessa järjestelmä ei voi toimia kunnolla ilman alentamisia ellei haluta inflaatiota käyntiin.

Ongelmana tässä vain on se, että alentamiselle pitäisi saada samanlaiset julkiset periaatteet kuin yllä korottamiselle tai muuten pelaajilla on oikeutettu epäilys luokituskomitean puolueettomuudesta kaikissa tilanteissa. Esimerkiksi tällä hetkellä täsmälleen ne pelaajat, jotka ovat Suomessa vähintään 3 dan, kuuluvat luokituskomiteaan. On vielä lisäksi niin, että kaikki luokituskomitean jäsenet ovat pääkaupunkiseudulta. Kaikista paras tilanne olisi silloin, kun luokituskomitea ei koostuisi ollenkaan go:n pelaajista, niin mitään ikäviä riippuvuussuhteita ei voisi syntyä. Käytännössä tasapuolisuus voi toteutua vain sillä, että eri kerhot saavat tasaisen edustuksen luokituskomiteaan.

-- Kari

Tuntuu siltä, että oikeasti tässä keskustelussa on kyse siitä, että luokituskomitean toiminta on edelleen epäselvää useimmille pelaajille - mitä en ihmettele. Omalta osaltani olen saanut tietoa ja perusteluja luokituskomitean päätöksiä, mutta se on tapahtunut vetämällä luokituskomitean jäseniä hihasta tyyliin --Hei, milloin mä saan sen dan-korotuksen????!--

Ratkaisuna olisi tietysti lisätä tiedotusta. Ikävä kyllä luokituskomitean jäsenyys on jälleen yksi nakkitehtävä vahvoille dan-pelaajille, ja kyseisillä henkilöillä noita nakkitehtäviä riittää. Joten toinen ratkaisu olisi ottaa luokituskomiteaan mukaan yksi edustaja kustakin maan go-keskuksesta. Tällöin jokaisen go-palaajan luulisi tuntevan ainakin yhden luokituskomitean jäsenen, jolle sitten voisi vuodattaa valituksensa ja miksei kehunsakin.

Kannatan siis Karin ehdotusta luokituskomitean muuttamisesta maata tasapuolisemmin edustavaksi. Vastustan tarkkojen ohjesääntöjen laatimista korotuksille. Nähdäkseni mutu-systeemin vahvuus on juuri siinä, että Suomen go-piirit ovat niin pienet, että luokituskomitea pystyy aivan oikeasti käyttämään monipuolista informaatiota luokituksia miettiessään. (Onko se siinä onnistunut, on eri kysymys. Nähdäkseni siedettävän hyvin ainakin. Joose pelaa muuten mielestäni shodanin tasolla ... :)

-- Otso Alanko

Ennustan että keskustelu luokituskomitean sijainnista räjähtää käsistä, loinpa siis luokituskomiteakeskustelun -- Mikael Runonen 14.4.2003

Luokituskeskustelu VI

Add new attachment

Only authorized users are allowed to upload new attachments.
« This particular version was published on 17-Apr-2003 16:20 by 194.241.75.27.