At line 882 added 18 lines |
|
Aineiston koko ei sinänsä vaikuta osa-aineistojen löytämiseen, koska taskun määritelmä on, että se on osapopulaatio joka pelaa pääasiassa keskenään. Tämän tunnistaminen taas on suhteellisen helppoa, ihan pelimäärien perusteella. |
|
Osituksen jälkeinen trendien löytäminen antaa aivan suoraa osviittaa siihen, että miten osapopulaatioiden sisäiset pelit ovat menneet, ja tämä sitten kiinnitetään muihin osapopulaatioihin kaikilla niillä peleillä jotka on saatavilla. Tästä saadaan omat tunnuslukunsa populaatioiden vĺiseen kehitykseen. Yksi osapopulaatio saattaa olla esmes jokaisen turnauksen kiertäjät, jotka siis eivät kuulu mihinkään muuhun populaatioon, ihan peliaineiston perusteella. |
|
Huomionarvoista on, että pelaajan pelituloksia tarkkaillaan ensisijaisesti ositetussa kontekstissa, ja sitten näistä osa-aineistojen välisistä suhteista nähdään, että onko osapopulaation pelitaso jotenkin muiden osapopulaatioiden tasoista poikkeava. Tämä taas palautetaan yksilöön siten, että kun tiedetään osapopulaation kehitys, voidaan siitä arvioida yksilöiden korotustarve. |
|
Karkea kuvitteellinen esimerkki voisi olla Oulu (15 tiukkaa nousijaa,) Tampere (20 stanganattia) ja kaikenkiertäjät (10 hengen kytkevä elementti.) On varsin järjetöntä yrittää vertailla näiden pelejä yksilötasolla, koska aineisto jää hyvin vähäiseksi, ja näin ollen tulosta ei juuri tule. Sen sijaan jos todetaan kyseessä olevan kolme koherenttia osapopulaatiota, lasketaan niiden väliset erot, ja siitä että miten kunkin osapopulaation hyvin- ja huonostimenestyvien suteellinen taso olisi, voidaan saada selvästi isompia ja merkityksellisempiä eroja kuin vain yksilöistä. |
|
Poikkeamien käsittely on erityisen tärkeää tällaisessa, koska ne muuten sotkevat osapopulaatioiden väliset suhteet. Tyypillisesti osittamisessa kannattanee keskittyä arviolta 80% aineistoon, siis suljetaan osapopulaatioiden välisten trendien laskemisesta outliereina sekä 10% parhaista että 10% huonoimmista (tai mikä tahansa prosenttitaso halutaankin, mutta kummankin poissuljetun hännän koko on parasta olla ainakin yksi henkilö) ja vasta näiden ydinpopulaatioiden suhteiden perusteella annetaan lisämerkitystä outliereille. Jos jokin osapopula ei ole riittävän iso että outliereita voidaan sulkea pois, se pitää käsitellä jollain muulla tavoin, koska silloin ollaan erityisen pahassa riskissä sotkea homma poikkeavilla havainnoilla. |
|
Olen henkilökohtaisesti täysin varma että tällainen malli olisi olennaisesti parempi kuin mikään heuristinen automaatti, eikä minulla ole epäilystäkään siitä etteikö tämä vetäisi mutulle turpiin melkoisen usein (kyllä, pidän mutua parempana kuin sokeaa heuristiikkaa.) Oma hatusta vedetty näppituntumani on, että tällä olisi tunnistettu ehkä neljännes enemmän sellaisia joita olisi pitänyt tarkkailla huolellisesti, ja jotka vain jäivät katveeseen kun työmäärän suuruuden takia jokaista ei voitu tarkkaan syynätä. Lisäksi olisi saatu systemaattisuutta asiaan, ja tietty huomattavasti parempia korotusperusteita. Puhumattakaan siitä että maan eri osien (l. kerhojen) väliset tasoerot olisivat tasoittuneet olennaisesti paremmin. |
|
Kaikki tämä sisältyy siis ylempänä olevaan mallin kuvaukseen. Ja uskon vahvasti tämän olevan vain yksi esimerkki siitä, miten paljon parempia tuloksia voidaan saada mallintamalla todellisuutta eikä miettimällä pisteautomaatteja. |
|
Sinänsä, Markku, jos kerta olet tuota heuristiikan mallintamista tekemässä, niin miksi ihmeessä et kertonut siitä aiemmin, ja antanut tuloksia muidenkin nähtäville? Et varmaan itsekään haluaisi muiden keksivän olennaisia muutoksia olemassaoleviin systeemeihin ilman että ne voidaan perustella? |
|
-- DonOlli |