At line 265 added 33 lines |
|
Poikkeamien neliösumma on kovin altis poikkeaville datapisteille |
(outlierit,) joita on poikkeuksetta biologispohjaisessa aineistossa |
joko vahemmän tai enemmän. Tässä joudun nojaamaan Helsingin Yliopiston |
biometrian apulaisporofessorin lausuntoihin, joita meikäläisellä ei |
tietenkään ole kirjallisena -- ellei sellaiseksi lasketa sitä |
luentomonistetta, jota hänelle vuosikymmenen ajan taitoin. Pikemminkin |
kuvittelisin jonkin maximum likelihood -mallin (ML) antavan |
järkevähköjä tuloksia erilaisten luokitusten sovittamisesta |
turnaustuloksiin, vaikka sekin olettaa jotain aineistosta |
(muistaakseni log-normaaliutta, mutta eipä ole tuo moniste käsillä |
juuri nyt.) |
|
Olenpa jopa sitä mieltä, että tuon professorin näkemys siitä, että |
aineiston ominaisuudet on tunnettava ennen kuin valitaan |
analyysimenetelmä ja malli jota yritetään käyttää, on aivan |
epäilemättä tällaisessa kriittistä. Jos aineiston ominaisuuksia ei |
tunneta eikä ehkä edes haluta tutkia, mallin antama järjestys on |
helposti uskottavuudeltaan liki sekoitetun korttipakan luokkaa. |
|
Sinänsä, nyt kun kuvaan tuli mukaan vahvalla tunnelatauksella varattu |
termi "reiluus," pesen välittömästi käteni keskustelusta. Reiluudella |
ei ole mitään tekemistä oikeellisuuden tai matemaattisen |
luotettavuuden/uskottavuuden kanssa. Pikemminkin päinvastoin, |
matemaattinen malli on pahimmillaan erityisen epäreilu, koska se ei |
voi ottaa huomioon mitään muuta kuin määrämuotoisen datan. Sen sijaan |
se sitten on oikeellisempi ja sen uskottavuus on tutkittavissa ja |
välillä jopa ymmärrettävissä. |
|
Esitänpä siis jälleen pahoitteluni siitä että osallistuin keskusteuun, |
ja yritän välttää sitä jatkossa. |
|
-- DonOlli |