!Linkkejä asiaan liittyviin sivuihin

[EhdotusLuokitustyökaluksi], [PäänahkaAnalyysi]

!!Kooste keskustelusta:

Markku: 
* Nykyisen (ihmisen arvioon perustuvan) luokittamisen ongelmat:
** luokittaminen perustuu luokittajien subjektiiviseen harkintaan.
   Tarvittaisiin systeemi jossa jokainen tietää mitä korottamiselta vaaditaan.
** Vähäinen määrä luokituskelpoisia pelituloksia vaatii
   harkinnan varan jättämistä systeemiin.

* Ehdotettu minimi-maksimikriteerisysteemi pyrkii huomioimaan molemmat yo.
  näkökannat, jonka pääpiirteet ovat:
** sovellus korotuksiin 1 dan - 7 daniksi
** tutkitaan pelaajan suoritusta kohdetasolla johon henkilöä harkitaan korotettavan
** jos minimikriteerit eivät täyty, pelaajaa ei edes harkita korotettavan 
** jos minimikriteerit täyttyvät, pelaaja voidaan harkinnan mukaan korottaa
** jos maksimikriteerit täyttyvät, pelaaja korottuu automaattisesti
** Maksimikriteeri auttaisi huomioimaan hitaiden etenijöiden ongelman:
   Pelaaja menestyy nimellistä luokitustaan paremmin, mutta jää
   korottamatta, koska turnauksissä päähuomio kiinnitetään nopeiten edenneisiin
   pelaajiin, jotka voittavat paljon pelejä. Hitaasti edistyneet jäävät paitsioon,
   koska heidän aiempia tuloksiaan ei oteta huomioon (esim. niiden etsimisen
   työläyden vuoksi)
** ehdotettu systeemi koostuu kolmesta kriteeristä: voitot kohdetasoa (1.) yhtä tai useampaa luokkaa vahvempia vastaan, (2.) samantasoisia vastaan ja (3.) yhtä tai useampaa luokkaa heikompia vastaan. Tarkasteltavana on sekä pelien määrä että voittoprosentti.
** ehdotus minimikriteereiksi: vaaditaan vähintään kaksi kriteeriä: (1.) 4 peliä, 25%, (2.) 6 peliä, 50%, (3.) 6 peliä, 60%.
** ehdotus maksimikriteereiksi: kaikki kolme kriteeriä vaaditaan: (1.) 6 peliä, 25%, (2.) 10 peliä, 50%, (3.) 6 peliä, 75%.
** systeemiin voidaan ottaa lisäksi mukaan vastustajien menestys turnauskohtaisesti

Antti S.:
* jos minimikriteerien pelimäärävaatimus liian korkea, miten nopeat 
  etenijät saadaan korotettua?

Gardan:
* systeemiä voitaisiin käyttää ohjeellisesti
* maksimikriiteerit saattaa ylittyä liian helposti jos pelimäärävaatimus ei ole
  tarpeeksi suuri

Olli:
* jos korottamiselta vaaditaan liian tiukat minimikriteerit, saattaa niiden saavuttaminen olla liian hidasta, jolloin luokitukset jäävät jälkeen todellisesta vahvuudesta. Tämä johtaisi tasokorotusten tarpeeseen, mitä ei haluta.

Markku:
* Jos minimikriteereistä tiputetaan pelimäärävaatimukset pois, voitaisiin nopeat
  nousijat korottaa tarpeen mukaan nopeasti.

Gardan:
* ehdotettu systeemi vaatii sen että joku pyörittää sitä ja huolehtii
  jatkotoimenpiteistä

Vesa:
* Jos minimikriteerit saavutetaan helposti ja maksimia ei moni ylitä, ei 
  systeemi poikkea oleellisesti nykyisestä järjestelmästä

Markku:
* Entä jos jätetään minimikriteerit pois ja pidetään pelkkä maksimikriteerit
  järjestelmässä?

Vesa:
* ehdotetut maksimikriteerit saattavat olla niin korkea että käytännössä 
  kukaan ei odottaisi niiden ylittymistä

Pekka:
* systeemi ohjeellisesti tulkittuna auttaisi korottajia, joille kriteerien
  ylittyminen antaisi lisätukea korottamisperusteita ajatellen

Kari:
* jos maksimikriteerit yliarvioidaan, ei siitä aiheutuisi haittaa
  verrattuna nykysysteemiin (koska kriteerin ehdot eivät täyty kuin harvoin)

Gardan:
* hitaiden etenijöiden ongelma poistuisi myös sillä että korottamatta jääneet 
  tapaukset tuodaan korotusoikeudet omaavien tietoon

Olli:
* Yhden turnauksen perusteella voidaan korottaa vain rajoitettu määrä
  pelaajia (dan-tasolle) turnauksesta saatavan rajallisen luokitusinformaation
  määrän vuoksi, jotta virheellisiä korotuksia ei tehdä (jotta
  luokitussysteemi ei hajoa sen takia että tehdään liikaa muutoksia
  liian nopeasti)
* pelaajan vastustajien todellinen vahvuus (nimellisvahvuuden sijaan)
  on tärkeää huomioida

Markku:
* jos korotukset annetaan yksittäisten turnausten perusteella, saavat korotuksen 
  vain nopeiten edenneet ja hitaasti edenneet jäävät helposti ilman korotuksia.

Oletettavasti kaikki:
* uuden systeemin käyttöönotolta vaaditaan ainakin kunnollinen testaus, jotta
  luokitukset eivät menetä merkitystään jos uusi systeemi toimii jotenkin
  virheellisesti

Otso:
* nykyinen systeemi ollut toiminnassa vasta vähän aikaa. Katsotaan miten se
  toimii ja kehitetään uutta systeemiä rauhassa

Pekka:
* Kaikki nykyiset luokitusoikeudelliset eivät välttämättä tiedä omaavansa 
  tai eivät uskalla käyttää korotusoikeuksiaan
* nykysysteemistä puuttuu vastuullinen luokittaja, minkä vuoksi ketään ei
  voi syyttää siitä että korotuksia jää antamatta. Pitäisikö luokitustoimikunta
  ottaa jossain muodossa takaisin?

Kari:
* voidaanko jotenkin todeta, toimiiko nykyinen järjestelmä hyvin?
* Karin ehdotus GOR-pohjaisen mallin käytöstä

Tuomo S.:
* luokitusjärjestelmien jako akselille mitätön mielivalta - täysi mielivalta
** Mitätön mielivalta -mallit eivät ehkä pysty käsittelemään poikkeustapauksia
** Täysi mielivalta -mallit voivat kärsiä siitä ettei tieto liiku
* Optimi ehkä jotain näiden väliltä.

Olli:
* järjestelmä ei saa olla liian monimutkainen jotta ihmiset noudattaisivat sitä
* tilastomatematiikan pohjalta johdettu systeemi saattaisi olla parempi vaihtoehto
  ehdotetulle minimi-maksimikriteerisysteemille
* Ollin suuntaviivat tilastolliselle populaatioanalyysisysteemille:
  etsitään populaatiot, joiden välillä vertaillaan tuloksia ja jonka
  avulla korotustarpeessa olevat huomataan

Henna:
* Systeemejä voitaisiin testata rinnakkain niin nähdään miten ne toimivat

Kari:
* etukäteen asetetuilla säännöillä voidaan varmistua
  järjestelmän tasapuolisuudesta ja urheilullisuudesta
* maksimirajan käyttö voi motivoida pelaajia parempiin suorituksiin
* Yleisellä tasolla minkä tahansa luokituskomitean toimintaa voidaan
  tutkia tilastollisesti
* mutu-järjestelmä on vain yhtä hyvä kuin sen luokittajat

Markku:
* uusi ehdotus kommenttien pohjalta työn alla, ks. [PäänahkaAnalyysi]

Antti V.:
* onko olemassa kriteereitä joilla voidaan arvioida minkä tahansa 
  systeemin toimivuus?



----

!!Markun alkuperäinen ehdotus:

Tarkoituksenani on esittää suuntaviivoja ihmisen suorittamaa luokittamista varten. Jo pitkään on puhuttu tarpeesta luoda säännöt luokittamista varten, joita sovellettaisiin tasapuolisesti kaikkia luokitettavia kohtaan. Tämä kirjoitus on raakaversio ja tarkoitettu julkisesti ruodittavaksi ja kollaboratiivisesti "lopulliseen" muotoon saatettavaksi. 

Nykyisessä järjestelmässä luokittaminen perustuu täydellisesti luokittajien subjektiiviseen harkintaan. Kuitenkin subjektiivinenkin harkinta perustuu johonkin, tiedosti luokittaja nämä tekijät tai ei. Voimassaolevan luokitusmääräyksen mukaan korkeimmat luokitukset perustuvat turnauspeleihin. Turnaustulokset sinänsä ovat pelkkiä merkkijonoja, jotka on jotenkin tulkittava, jotta niiden pohjalta voidaan päättää yhtään mistään. Yleensä urheilulajeissa palkinnot ja arvonimet annetaan yleisesti tunnettujen kriteerien perusteella. Toisaalta vähäinen datamäärä voi pakottaa joissakin tilanteissa käyttämään harkintaa. Siksi mielestäni paras systeemi olisikin sellainen, jossa on määritelty korottamiseen vaaditut __minimi__- ja __maksimi__meriitit. Näitä kriteereitä
sovellettaisiin ehdotukseni mukaan kaikissa korotuksissa luokitusvälillä 1 dan - 7 dan. Sitä heikommat luokitukset perustuvat pakostakin liiaksi kerhopeleihin.

Yksi yleisesti käytetty lähestymistapa korottamiseen on arvioida pelituloksia siitä näkökulmasta, miten pelaaja on pärjännyt kohdetasoiseksi pelaajaksi. Paras vertailumateriaali esimerkiksi 1 kyun pelaajalle, jota harkitaan shodaniksi korotettavaksi, löytyy hänen peleistään (esim. sinä aikana kun hän on ollut 1 kyu) kohdetasoa (1 dan) välittömästi heikompia vastaan (1 kyut), samantasoisia (1 danit) ja välittömästi korkeampitasoisia vastaan (2 danit). Jos korotettava näyttää pärjänneen, kuten uudella luokituksella "keskimäärin kuuluukin" pärjätä, hänet korotetaan. Esimerkiksi shodan-kandidaatin tapauksessa seuraava näyttö voitaisiin katsoa riittäväksi:

\\2d: 2/6
\\1d: 4/8
\\1k: 5/7

Tässä tapauksessa korotettava on voittanut puolet shodaneista, kolmasosan nidaneista ja selvästi yli puolet ikkyuista. Intuitiivisesti arvioiden useimmat ihmiset luultavasti pitäisivät tällaista tulosta riittävänä.

Vaikeammaksi meriittien arvioiminen menee, jos vertailuaineisto on jollakin tavoin epätäydellistä. Siis esimerkiksi silloin, jos vahvempia vastaan pelattuja pelejä on vähän. Esimerkiksi:

\\2d: 0/3
\\1d: 5/9
\\1k: 8/9

tai

\\2d: 2/7
\\1d: 0/0
\\1k: 4/6

Yksi ehdotus __minimi__meriitiksi tällaisessa lähestymistavassa, jonka ansaitsemisen jälkeen korottamista __voidaan harkita__, olisi mielestäni se, että pelaaja on saavuttanut vähintään __kaksi kolmesta__ seuraavasta: 

* voittanut vähintään 25% vähintään yhden luokan kohdeluokitusta paremmmista vähintään neljässä pelissä (vähintään kolme luokkaa kohdetasoa vahvemmille häviämistä ei laskettaisi)
* vähintään 50% kohdetasoisesti luokitetuista ja vähintään kuudessa pelissä 
* vähintään 60% kohdetasoa heikommista vähintään kuudessa pelissä (vähintään kolme luokkaa kohdetasoa heikompien voittamista ei laskettaisi)

(Huomautus: Ylläoleva tarkoittaisi sitä, että kenellekään voitaisi antaa dan-korotusta yhdessä turnauksessa pl. EGC. Vähintään tarvittavaan 10 peliin voisi riittää tyypillisesti kaksi viiden kierroksen turnausta.)

Yksi ehdotus vaadittavaksi __maksimi__meriitiksi tässä lähestymistavassa, jonka jälkeen korotus seuraisi __automaattisesti__, olisi se, että pelaaja olisi saavuttanut __kaikki kolme__ seuraavista: 

* voittanut vähintään 25% kohdetasoa vähintään yhden luokan vahvemmista vähintään kuudessa pelissä (vähintään kolme luokkaa kohdetasoa vahvemmille häviämistä ei laskettaisi)
* vähintään 50% kohdetasoisista vähintään kymmenessä pelissä 
* vähintään 75% kohdetasoa heikommista vähintään kuudessa pelissä(vähintään kolme luokkaa kohdetasoa heikompien voittamista ei laskettaisi)

(Huomautus: automaattinen korotus siis vaatisi vähintään 22 peliä eli noin 4-5 tyypillistä 5-6 kierroksen turnausta.)

Luokittamissääntöjen on myös pakko ottaa kantaa siihen, miten tutkittava pelitulosaineisto rajataan. Oma alustava näkemykseni on seuraava:

* vain tasa-alkupelejä mukaan.
* kelpuutettujen turnausten oltava kelvollisia vähintään EGF:n B-luokkaan (ei välttämättä EGF:ään lähetettyjä)
* korotettavan eduksi tulkitaan lyhin riittävän hyvä turnaustulosten (katkeamaton) jono alkaen viimeisimmästä (kahden edellisen kriteerin nojalla) kelpuutetusta turnauksesta ajallisesti taaksepäin tutkittaessa __voidaanko__ pelaajan korottamista harkita - silloin siis riittää, jos 10 __vähintään__ viimeistä peliä ovat menneet riittävän hyvin (ks. edellä). 
* toisaalta tutkittaessa onko pelaaja __pakko__ korottaa, mikä hyvänsä viimeisimmästä alkava riittävän hyvin mennyt turnausten (katkeamaton) jono kelpuutetaan

Lisäksi tähän ehdotukseen __voisi__ kuulua, että vastustajien kussakin turnauksessa osoittama pelikunto otetaan huomioon arvioimalla heidän luokitustaan kyseisessä turnauksessa tarvittaessa alaspäin yksi luokka yhtä voittomäärän odotusarvosta puolentoista suuruista poikkeamaa kohti (arvio alaspäin pyöristetään lähimpään pienempään kokonaislukuun):

\\0/5 -> yksi luokka (odotettu voittomäärä 2.5)
\\1/5 -> yksi luokka 
\\2/5 -> ei arvioida alaspäin
\\0/6 -> kaksi luokkaa (odotettu voittomäärä 3)
\\1/6 -> yksi luokka 
\\2/6 -> ei arvioida 
\\0/7 -> kaksi luokkaa (odotettu voittomäärä 3.5)
\\1/7 -> yksi luokka 
\\2/7 -> yksi luokka 
\\3/7 -> ei arvioida alaspäin (
\\0/8 -> kaksi luokkaa (odotettu voittomäärä 4)
\\1/8 -> kaksi luokkaa 
\\2/8 -> yksi luokka 
\\3/8 -> ei arvioida alaspäin
\\0/9 -> kolme luokkaa (odotettu voittomäärä 4.5)
\\1/9 -> kaksi luokkaa 
\\2/9 -> yksi luokka
\\3/9 -> yksi luokka
\\4/9 -> ei arvioida alaspäin
\\0/10 -> kolme luokkaa (odotettu voittomäärä 5)
\\1/10 -> kaksi luokkaa
\\2/10 -> kaksi luokkaa
\\3/10 -> yksi luokka
\\4/10 -> ei arvioida alaspäin



Arviointia ylöspäin EI TEHDÄ McMahon turnauksen HUIPPURYHMÄSSÄ pelaaville, koska huippuryhmässä pelaavat joutuvat pelaamaan "liian usein" nominaalisesti heikompia vastaan. Muutoin vastustajan luokituksen arviointi ylöspäin tehdään samoin kuin arviointi alaspäin eli näin (arvio ylöspäin pyöristetään lähimpään pienempään kokonaislukuun):

\\ 3/5 -> ei arvioida ylöspäin (odotettu voittomäärä 2.5)
\\ 4/5 -> yksi luokka
\\ 5/5 -> yksi luokka
\\ 4/6 -> ei arvioida ylöspäin (odotettu voittomäärä 3)
\\ 5/6 -> yksi luokka
\\ 6/6 -> kaksi luokkaa
\\ 4/7 -> ei arvioida ylöspäin (odotettu voittomäärä 3.5)
\\ 5/7 -> yksi luokka
\\ 6/7 -> yksi luokka
\\ 7/7 -> kaksi luokkaa
\\ 5/8 -> ei arvioida ylöspäin (odotettu voittomäärä 4)
\\ 6/8 -> yksi luokka
\\ 7/8 -> kaksi luokkaa
\\ 8/8 -> kaksi luokkaa
\\ 5/9 -> ei arvioida ylöspäin (odotettu voittomäärä 4.5)
\\ 6/9 -> yksi luokka
\\ 7/9 -> yksi luokka
\\ 8/9 -> kaksi luokkaa
\\ 9/9 -> kaksi luokkaa
\\ 6/10 -> ei arvioida ylöspäin (odotettu voittomäärä 5)
\\ 7/10 -> yksi luokka
\\ 8/10 -> kaksi luokkaa
\\ 9/10 -> kaksi luokkaa
\\ 10/10 -> kolme luokkaa

-- Markku 6.6. 2005

---------------------------------------------------------------------------------------------

!Esimerkki kriteerien laskennasta:

Antin data 1 kyuna:

\\ 5d   0.00% (0/3)
\\ 3d   0.00% (0/1)
\\ 2d  16.67% (1/6)
\\ 1d  50.00% (8/16)
\\ 1k  73.68% (14/19)
\\ 2k 100.00% (4/4)
\\ 3k  62.50% (5/8)
\\ 4k  50.00% (1/2)
\\ 7k 100.00% (1/1)
\\ 9k 100.00% (1/1)
\\15k 100.00% (1/1)

Eli selostanpa tarkemmin miten tämä ylittää määrittämäni minimimeriitit.
Kohdetasoa vahvemmat eli 5d-2d. Tappioita vähintään kolme luokkaa kohdetasoa vahvempia vastaan eli tappioita 5 daneja vastaan ei lasketa. Voittoprosentti vahvempia vastaan siis: 1/7 = n. 14%. Kohdetasoisia vastaan 8/16 = 50% (vähintään 6 peliä). Kohdetasoa heikompia vastaan (voittoja 3 kyuita vastaan ei oteta huomioon): voitot 14+4=18, pelit 19+4+3(=tappiot 3 kyuille)=26; voittoprosetti 18/26= n.69%.

Eli siis kohta "voittoprosentti vahvempia vastaan vähintään 25%" (tappiot 3 luokkaa kohdetasoa vahvempia vastaan poisluettaan) ei toteudu. Kohta "kohdetasoisista vähintään 50% vähintään 6 pelissä" toteutuu. Kohta "kohdetasoa heikommista vähintään 60%" (voitot vähintään 3 luokkaa heikommista poisluetaan) toteutuu. Siis kaksi kolmesta kohdasta toteutuu => saa korottaa.

Riittävän hyvä tulos ollakseen minimimeriittiä parempi.

-- Markku, 16.6.

----

!!Karin ehdotus

Jos oletetaan, että puhutaan järjestelmästä, joka on suunnattu dan-korotuksiin ja tasa-avaus go:hon 
(kyu-luokituksissa mielestäni voidaan sallia aika suuri vapaus), niin itse lähtisin hahmottelemaan järjestelmää
siten, että dan-tasot määrittyisivät teoreettisen gor-mallin kautta. Kun tarkastellaan pelaajan korotusta
kohdetasolle X, laskettaisiin gor-mallin mukainen todennäköisyys pelaajan viimeiselle
tulosriville (vapaasti valittavasta alkuhetkestä lähtien) väitteelle "luokitus on vähintään X" ja
minimi- ja maksimirajat asetettaisiin tälle todennäköisyydelle. Esim. 50% ja 95% tjsp. Järjestelmään voitaisiin
jättää joustovaraa luokitustoimikunnalle siten, että riippuen yleisestä luokitusten tasosta, toimituskunta
voi etukäteen säätää rajoja kokouksissaan. Näin saadaan samalla kaikille tasapuolinen, objektiivinen, 

seurattava järjestelmä, joka bonuksena jättää luokitustoimikunnalle mahdollisuuden säätää korotusten
yleisherkkyyttä, jotta järjestelmää voidaan säätää ja korjata.

-- Kari 20.6

----

!!Ollin ehdotus

Ja nyt tuli puheeksi, niin itse olen miettynyt erilaisia tilastomenetelmiä sisltävää mallia. Esimerkiksi sellaista, jossa

* etsitään ja suljetaan pois outlierit (mahdollisesti eri vaiheissa)
* etsitään alipopulaatiot
* etsitään alipopulaatioiden sisäisiä ja välisiä trendejä
* selvitetään näiden perusteella, että ketkä saavat odottamattoman hyviä tuloksia

Voi olla että Laurin tutkimat mallit ovat olennaisesti parempia, koska Max Likelihood -malli saattaa antaa tämän kaiken sivutuotteena (tosin muistaakseni LM:n log-normaaliusvaatimus voi oikeasti aiheuttaa ongelmia,) mutta ainakin on uskottavaa että se olisi hyvä malli. Tällainen olisi ainakin paremmin perusteltavissa kuin useimmat muut mallit, koska:

* se käsittelee poikkeavat datapisteet (outlierit)
* se hallitsee taskuuntumisen osittamalla
* se hallitsee taskujen väliset pelit
* se ottaa huomioon pelijatkumot ja niiden katkokset
* se kykenee laskemaan tunnusluvut kaikille tarpeellisille asioille ja niiden virhe-estimaatit

Tämä antaisi aivan eri luokan lähdemateriaalin luokitussysteemin pohjaksi kuin mikään aiemmin tuntemani. Vielä edistyneempi malli voi laskea pelijatkumon ajan funktiona (jonka Lauri totesi erinomaisen selittäväksi) sekä erilaisia tunnuslukuja sille, että onko jokin datapiste poikkeama, sillä poikkeamia normistahan tässä haetaan. 

Näistä mitään ei heuristinen malli osaa, vaan tässäpä asioita mallinnetaankin oikealla tilastotieteellä. Tällainen kuitenkin vaatisi huomattavasti laajempaa lähdemateriaalia (l. tilastotieteen kirjallisuutta) kuin meikäläisellä on saatavilla, sekä aivan epäilemättä jonkun oikean matemaatikon. Ja paljon työtä ja kärsivällisyyttä.

Ei, en todellakaan pidätä henkeäni. Mutta odotan edelleen mielenkiinnolla Laurin jatkotuloksia.

-- DonOlli, 20.6.2005


Aineiston koko ei sinänsä vaikuta osa-aineistojen löytämiseen, koska taskun määritelmä on, että se on osapopulaatio joka pelaa pääasiassa keskenään. Tämän tunnistaminen taas on suhteellisen helppoa, ihan pelimäärien perusteella.

Osituksen jälkeinen trendien löytäminen antaa aivan suoraa osviittaa siihen, että miten osapopulaatioiden sisäiset pelit ovat menneet, ja tämä sitten kiinnitetään muihin osapopulaatioihin kaikilla niillä peleillä jotka on saatavilla. Tästä saadaan omat tunnuslukunsa populaatioiden vĺiseen kehitykseen. Yksi osapopulaatio saattaa olla esmes jokaisen turnauksen kiertäjät, jotka siis eivät kuulu mihinkään muuhun populaatioon, ihan peliaineiston perusteella.

Huomionarvoista on, että pelaajan pelituloksia tarkkaillaan ensisijaisesti ositetussa kontekstissa, ja sitten näistä osa-aineistojen välisistä suhteista nähdään, että onko osapopulaation pelitaso jotenkin muiden osapopulaatioiden tasoista poikkeava. Tämä taas palautetaan yksilöön siten, että kun tiedetään osapopulaation kehitys, voidaan siitä arvioida yksilöiden korotustarve.


Karkea kuvitteellinen esimerkki voisi olla Oulu (15 tiukkaa nousijaa,) Tampere (20 stanganattia) ja kaikenkiertäjät (10 hengen kytkevä elementti.) On varsin järjetöntä yrittää vertailla näiden pelejä yksilötasolla, koska aineisto jää hyvin vähäiseksi, ja näin ollen tulosta ei juuri tule. Sen sijaan jos todetaan kyseessä olevan kolme koherenttia osapopulaatiota, lasketaan niiden väliset erot, ja siitä että miten kunkin osapopulaation hyvin- ja huonostimenestyvien suteellinen taso olisi, voidaan saada selvästi isompia ja merkityksellisempiä eroja kuin vain yksilöistä.

Poikkeamien käsittely on erityisen tärkeää tällaisessa, koska ne muuten sotkevat osapopulaatioiden väliset suhteet. Tyypillisesti osittamisessa kannattanee keskittyä arviolta 80% aineistoon, siis suljetaan osapopulaatioiden välisten trendien laskemisesta outliereina sekä 10% parhaista että 10% huonoimmista (tai mikä tahansa prosenttitaso halutaankin, mutta kummankin poissuljetun hännän koko on parasta olla ainakin yksi henkilö) ja vasta näiden ydinpopulaatioiden suhteiden perusteella annetaan lisämerkitystä outliereille. Jos jokin osapopula ei ole riittävän iso että outliereita voidaan sulkea pois, se pitää käsitellä jollain muulla tavoin, koska silloin ollaan erityisen pahassa riskissä sotkea homma poikkeavilla havainnoilla.

Olen henkilökohtaisesti täysin varma että tällainen malli olisi olennaisesti parempi kuin mikään heuristinen automaatti, eikä minulla ole epäilystäkään siitä etteikö tämä vetäisi mutulle turpiin melkoisen usein (kyllä, pidän mutua parempana kuin sokeaa heuristiikkaa.) Oma hatusta vedetty näppituntumani on, että tällä olisi tunnistettu ehkä neljännes enemmän sellaisia joita olisi pitänyt tarkkailla huolellisesti, ja jotka vain jäivät katveeseen kun työmäärän suuruuden takia jokaista ei voitu tarkkaan syynätä. Lisäksi olisi saatu systemaattisuutta asiaan, ja tietty huomattavasti parempia korotusperusteita. Puhumattakaan siitä että maan eri osien (l. kerhojen) väliset tasoerot olisivat tasoittuneet olennaisesti paremmin.

Kaikki tämä sisältyy siis ylempänä olevaan mallin kuvaukseen. Ja uskon vahvasti tämän olevan vain yksi esimerkki siitä, miten paljon parempia tuloksia voidaan saada mallintamalla todellisuutta eikä miettimällä pisteautomaatteja.

-- DonOlli 

----

Minulta voi tilata dataa, jos omaa ei ole, siistissä tekstitiedostomuodossa, jossa on riveittäin pelaajien ja voittajan nimet yksikäsitteistetyssä EGF-muodossa sekä näiden pelin aikaiset luokitukset ja kansallisuudet, ajankohta ja turnaus, jossa peli pelattiin.

-- Markku, 21.6.

Onko jollakulla käytössä näppärää työkalua, jolla saisi näytille graafin, jossa solmut edustavat pelaajia ja kaaret pelattuja pelejä. Olisi todella mielenkiintoista ja valaisevaa osapopulaatioiden erottamista ajatellen nähdä kuva. Suomalaisten pelit halutulta aikaväliltä voin toimittaa tekstitiedostona.

-- Markku

No niin, tässä on nyt tietokantapulauttimestani haetut kaikkiin dan-korotuksiin vuoden 2000 aikana tai sen jälkeen vaaditut meriitit. Tulosriveistä on poistettu kaikki tappiot vähintään kolme luokkaa vahvemmille ja kaikki voitot vähintään kolme luokkaa heikompia vastaan. Tuloksille ei ole tehty "vastustaja-analyysejä" eli ei ole arvioitu vastustajan nominaaliluokitusta ylös- tai alaspäin tämän samassa turnauksessa menestymisen perusteella. Vastustajien nominaaliluokitusten korjaukset tulevat tuloksiin hyvin pian. Alustavan selvityksen mukaan kuitenkaan niillä ei ole kovin suurta vaikutusta pitkissä tulosriveissä varsinkaan isoissa turnauksissa, koska joidenkin vastustajien pelatessa nominaalisen tasonsa alapuolella, joidenkin vastustajien pelaaminen nominaalisen tasonsa yläpuolella kompensoi sen. 

|Pelaajan nimi|Korotus mistä mihin|6d|5d|4d|3d|2d|1d|1k|2k|3k|4k|5k|6k|
|AnttiH|1k->1d|-|-|-|0/1|1/5|8/15|13/19|3/4|0/1|
|AnttiH|1d->2d|-|-|1/2|3/5|3/8|6/10|2/2|
|AnttiT|1k->1d|-|-|-|-|2/3|5/6|1/1|
|AnttiT|1d->2d|-|1/1|-|0/1|3/4|2/2|1/1|
|AnttiT|2d->3d|1/1|0/3|0/1|5/11|10/13|3/3|0/1|
|Einari|1k->1d|-|-|-|-|2/4|4/7|2/5|6/8|
|Esa|1d->2d|-|-|0/1|2/7|6/7|5/8|2/3|
|Jaakko|1k->1d|-|-|-|0/3|3/11|8/13|7/8|7/11|0/1|
|Joose|1k->1d|-|-|1/2|0/2|1/3|3/7|4/7|2/2|
|Joose|1d->2d|-|1/1|2/3|0/1|4/6|2/4|
|Kare|2k->1d|-|-|-|-|1/1|2/4|3/5|3/4|
|Kare|1d->2d|-|-|1/6|3/5|9/12|13/24|4/6|
|Kare|2d->3d|-|2/6|1/2|5/8|5/6|5/6|
|Kari|2k->1d|-|-|-|-|2/3|1/2|1/2|2/5|
|Kari|1d->2d|-|-|0/3|1/2|7/8|11/16|4/5|
|Lauri|1k->1d|-|-|-|1/2|4/7|2/4|
|Otso|1k->1d|-|-|-|1/2|1/3|2/2|2/4|1/1|-|0/1|
|Otso|1d->2d|-|-|2/3|2/4|9/11|3/7|0/1|
|Paavo|2k->1d|-|-|-|-|0/4|4/8|3/7|1/4|
|Seppo|1k->1d|-|-|-|0/3|4/10|5/12|6/10|8/9|-|0/1|
|Simo|2k->2d|-|-|1/1|2/5|3/5|3/3|1/1|
|TeemuH|1k->1d|-|-|-|-|2/3|3/4|4/5|
|TeemuH|1d->2d|-|1/3|1/1|-|2/3|2/5|1/2|
|TeemuR|2k->1d|-|-|-|0/2|1/3|0/2|1/5|10/13|-|-|-|0/2|
|Timo|1k->2d|-|-|1/2|1/2|1/2|2/3|2/3|
|Timo|2d->3d|-|2/6|1/4|4/5|1/1|1/3|-|0/1|
|Tuomo|1k->1d|-|-|-|1/4|5/11|6/9|11/18|8/9|0/1|

Puuttuu vielä Esa 2k->1d.

|Pelaajan nimi|Mistä mihin|Pelit vahv.|Pelit kohd.|Pelit heik.|
|AnttiH|1k->1d|1/6|8/15|14/24|
|AnttiH|1d->2d|4/7|3/8|8/12|
|AnttiT|1k->1d|2/3|5/6|1/1|
|AnttiT|1d->2d|1/2|3/4|3/3|
|AnttiT|2d->3d|1/5|5/11|13/17|
|Einari|1k->1d|2/4|4/7|8/13|
|Esa|1d->2d|2/8|5/8|2/3|
|Jaakko|1k->1d|3/14|8/13|14/20|
|Joose|1k->1d|2/7|3/7|6/9|
|Joose|1d->2d|3/5|4/6|2/4|
|Kare|2k->1d|1/1|2/4|6/9|
|Kare|1d->2d|4/11|9/12|17/30|
|Kare|2d->3d|3/8|5/8|10/12|
|Kari|2k->1d|2/3|1/2|3/8|
|Kari|1d->2d|1/5|7/8|15/21|
|Lauri|1k->1d|5/9|2/4|-|
|Otso|1k->1d|2/5|2/2|3/6|
|Otso|1d->2d|4/7|9/11|3/8|
|Paavo|2k->1d|0/4|4/8|4/11|
|Seppo|1k->1d|4/13|5/12|14/20|
|Simo|2k->2d|3/8|3/5|4/4|
|TeemuH|1k->1d|2/3|2/5|1/2|
|TeemuH|1d->2d|2/4|2/3|3/7|
|TeemuR|2k->1d|1/5|0/2|11/18|
|Timo|1k->2d|2/4|1/2|4/6|
|Timo|2d->3d|3/10|4/5|2/5|
|Tuomo|1k->1d|6/15|6/9|19/28|

Yllä on pelkästään yhteenvedot tuloksista. Jos joku haluaa tutkia tarkemmin turnaustuloksia, voin liittää tai copypasteta tänne turnaustietokantapulauttimeni tuottamat  pelaajakohtaiset yhteenvedot pelituloksista vastustajien tasoittain, listat peleistä ja vastustajista luokituksineen sekä päivämäärineen ja listat kussakin yhteenvedossa mukana olevista turnauksista. 

-- Markku, 22.6. 2005

Ehdotan, että joku suorittaa tälle sivulle [NPOV|http://en.wikipedia.org/wiki/NPOV]-menetelmän mukaisen siivouksen.  Keskustelun (erityisesti näin pitkäksi ja henkilökohtaisuuksiin venyneen) editointi, muokkaus ja tiivistäminen olisi erittäin positiivinen asia.

-- Janne

Yritin tehdä koosteen keskustelusta, ks. sivun alku. Korjatkaa jos ymmärsin jotain väärin.

-- Tuomo K., 23.6.2005


Hyvä, mutta sellaisen keskustelun osan, joka on jo tiivistetty, voisi poistaa.

-- Janne 

Poistin suurimman osan sivuston keskustelusta. Jos poistin tekstiä liiaksi jonkun mielestä niin sivuhistoriasta saa kaivettua haluamansa vanhat tekstit takaisin.

Jätin Karin ja Ollin systeemiehdotusten tekstit tuohon ylle. Olisi ehkä hyvä jos Kari ja Olli siirtäisivät ne omille sivuilleen ja muokkaisivat niistä haluamansa esityksen.

-- Tuomo K. 1.7.2005