Ettei koko ajan tarvitsis tapella merkistöistä, ehdotan, että #go.fi -kanavalla siirrytään kertaheitolla UTF-8 -merkistöön, esim. 1.4.2006. Käytännössä tämä tarkoittaisi sitä, että nykykäytännöstä, jossa nuristaan, kun ihmiset huutavat UTF-8:aa kanavalle, siirrytään käytäntöön, jossa nuristaan, jos kanavalle tuotetaan jotain muuta kuin UTF-8 -merkistöä.
Hyviä(?) syitä siirtoon:
- Ei enää merkistötappeluita (as if)
- Japaninkielisiä merkkejä voi heittää tekstin joukkoon (go kuitenkin on itämaalainen peli, joten tämä on jossain määrin perusteltua)
- UTF-8 on standardi, ja monet muut kanavat ovat siirtyneet jo siihen. Tämä parantaa yleistä maailman harmoniaa ja tekee paremman muodon.
- UTF-8 on pääasiallisesti englantia puhuvissa serveriverkoissa (esim. freenode) jo oletus.
Syitä olla siirtymättä:
- mIRC-klientin käyttäjät joutuvat lataaman ulkopuolisen tekijän skriptin ja ajamaan kaksi riviä komentoja.
- irssiä ainakin Debianissa tai Gentoossa käyttävät joutuvat asentamaan uuden asiakkaan vakaan jakelun ulkopuolelta tai kolmannen osapuolen skriptin.
- Edelliset aiheuttavat turhaa ja hankalaa säätöä varsinkin niille jotka eivät ole järin perehtyneitä tietotekniikan syviin saloihin tai eivät ylläpidä itse omia irkkikoneitaan.
- Nyt käytetyt ISO 8859-1 ja -15 ovat standardeja ja niillä on laaja ja kypsä tuki takanaan. Monet IRC-kanavat käyttävät niitä.
Äänestäkää alle (koskee vain IRCissä huutelevia). Äänestys uusitaan noin puolen vuoden välein, kunnes enemmistö on samaa mieltä kuin minä.
Mikäli äänestyksen tulos on negatiivinen, niin utf-8:aa kanavalle suoltavat saa potkia vapaasti pois (kun ensin on viitattu tälle sivulle).
Viimeinen äänestyspäivä on 31.1.2006. Äänestämättä jättäneet lasketaan "ei väliä" -ääniksi. Mikäli vähintään puolet annetuista äänistä on puolesta, kanavan merkistökoodaukseksi muuttuu UTF-8 1.4.2006.
Äänestys 1H2006#
Puolesta: JanneJalkanen MarkusKoivisto LauriPaatero JariLeppänen Juhtolv MarkusRunonen Tapio Vuorinen AnssiMattus Pekka Wallendahl Mika Urtela Antti Mankinen Juho Pennanen Hannu-Pekka Rajaniemi Alex Grönholm Ilkka Mattila hena TeemuHirsimäki
Vastaan: JariKoivikko Ilkka Virta JanneNikula Toni Nisumaa Markus Hietava Ville Pietarinen
Ei väliä:
Satunnaista keskustelua#
Pyytämättä kommentoin alkup. tekstin kirjoittajalle että väitteet muotoa "monet kanavat ovat..." voi myös perustella, esim. listaamalla kanavat tai muuten. Tää tekee väitteestä paremman. -Ilkka
Kas tässä monien muitten kanavien tilanne: http://wiki.tukaani.org/utf-8_ja_irc-kanavat -- Juhtolv
Olen periaatteesta tukemassa tätä, mutta voipi olla, että jos ihmettä ei tapahdu ja irssin 0.8.10 -versio ilmesty Debianin stableen niin joudun säätämään itselleni uuden irc-shellin, ja joo ei tahdo sorsatkaan kääntyä. :/ -Pekka
- backports.org:ista näyttäisi löytyvän irssin 0.8.10 -portti debian stablelle. En tosin ole testannut. --JanneJalkanen
Toi backports.org:ista otettu irssi 0.8.10 on jo muutaman päivän ollut koneessa wildeast.cc.jyu.fi, jossa on Debianin stable-versio ja hyvin näyttää toimivan. -- Juhtolv
Syitä vastaan: http://stnz.fi/anti-utf8/
Satiiri tms. edellisestä: http://johan.kiviniemi.name/stuff/anti-8bit -- Juhtolv
Itse olen sitä mieltä että iso-latinin käyttö voi hyvin jatkua, mutta että utf-8 aiheinen kitinä sitä käyttäville voisi loppua. Merkistöväännöt alkavat pikkuhiljaa kyllästyttää: loppujen lopuksi kysymys on koska utf-8:aan siirrytään, eikä siirrytäänkö. Miksei siis siirryttäisi nyt? On turhaa antaa yhden klientin (tässä tapauksessa viittaan mIRC-klienttiin) pitää muita panttivankina, varsinkin kun siihenkin klienttiin on olemassa kolmannen osapuolen tarjoama tuki merkistölle. - MarkusKoivisto
Ehdotuksen kohtaa "siirrytään käytäntöön, jossa nuristaan, jos kanavalle tuotetaan jotain muuta kuin UTF-8 -merkistöä" voisi olla hyvä tarkentaa. Laajasti tulkiten sen voi ymmärtää esimerkiksi järjestelmälliseksi latin1-käyttäjien potkimiseksi pois kanavalta mutta toisaalta sen voisi ymmärtää myös maltillisesti latin1:n käytön jatkumiseen utf-8:n rinnalla. Koska näiden välille jää aika iso käytännön ero, asiaa voisi olla hyvä tarkentaa. Varsinkin minua kiinnostaa, miten esimerkiksi lyhyitä ensivierailua tekeviä aloittelevia gon pelaajia aiotaan tässä suhteessa kohdella. Potkut sellaisessa tilanteessa nimittäin olisivat aika raju veto ja tuskin antaisivat kovin hyvää kuvaa Suomen go-harrastajista. -JanneNikula
Tarkoitin asian niin, että tällä hetkellä utf-8:aa suoltaville huudetaan "korjaa klienttisi", niin vaihdetaan toisinpäin... Tokko sieltä ketään potkitaan ulos (paitsi niitä, jotka jatkuvasti jaksavat valittaa siitä, että miksi tehtiin niin ja näin ja miksei jo siirrytä utf-8:aan tai latin9:ään tai macromaniin tai what ever). Sodat eivät kiinnosta ketään, ja tämän jälkeen ainakin on olemassa jonkinasteinen konsensus asialle. Sen jälkeen valittajille voidaan näyttää wikisivu, ja käskeä keskittymään johonkin oleelliseen. -- JanneJalkanen
Oleellista on myös, että kuinka moni voi halutessaan siirtyä. Esim he jotka ainoastaan joltain koululta irkkaavat eivät yleensä määrätä mitä versiota käytetään. Esim TKK:n niksulassa on tällä hetkellä irssistä versio 0.8.9. Siihen sai kai jotenkin säädettyä skriptin, joka tukee riittävästi, mutta kaikki eivät välttämättä osaa tai pysty. Suurin osa ei osaavista on yleensä ylläpidon armoilla jo senkin suhteen mitä clienttiä käytetään. Tämän takia olisi mukava tietää kuinka suurelle osalle siirtyminen on a)triviaalia b)mahdollista c) mahdotonta. -- JariKoivikko
Jos käytössä on edellämainittu irssi 0.8.9, siirtyminen on triviaalia. Vaikea uskoa että TKK:lla ei ole perl-tukea käytössä lainkaan, ja jos se kerran on, niin recode-ion ja muut skriptipohjaiset ratkaisut tarjoavat kaiken vaadittavan. Jos käytössä on mIRC, siirtyminen on triviaalia - se vaatii yhden skriptin lataamisen ja käynnistämisen. Jos käytössä on x-chat, siirtyminen on triviaalia. Jos käytössä on vanha ircII tai vastaava, siirtyminen on mahdollista, mutta vaatii locale-vaihdoksen. -- Markus Koivisto
Itseasiassa jo irssi v.0.8.6 osasi UTF-8:n, ilmeisesti localen kautta, mutta vasta v0.8.10:ssä tuli sisäänrakennettu recode-tuki ja muitten viesteissä käytettyjen merkistöjen autodetectointi. charsetwars.pl puolestaan on vanhemmille irsseille tarkoitettu skripti, jolla se tunnistaa muitten käyttämiä merkistöjä ja konvertoi niitä. Jos hengaa vain UTF-8-kanavilla, niin voi pistää vanhemmankin irssinsä UTF-8:aa käyttämään. -- Juhtolv
Kannattaa lukea kommentteineen päivineen myös nämä mieluummin ennen äänestystä. Tosin voi kai sitä ääntään vaihtaa ennen deadlineä, jos muutti mieltään: http://wiki.tukaani.org/keskustelu:irc_ja_utf-8 http://wiki.tukaani.org/irc_ja_utf-8 -- Juhtolv
Windowsissa utf-8:aan siirtymistä on nyt tullut testattua. Kokeilin kolmea clienttia, ja tulokset eivät ainakaan toistaiseksi vakuuta. Näin siinä kävi:
- mIRC: skriptillä näkee utf-8:aa mutta antaa edelleen ulos cp-1252:ta eli ei kelpaa, japanin kirjoitus ei tuettu
- X-Chat: Ei natiivi win32-ohjelma (käli käyttää GTK+:aa), josta aiheutuu ongelmia mm. japania kirjoittaessa (teksti ilmestyy aivan muualle kuin syöttöruutuun)
- Kvirc: Japanin kirjoitus ei toiminut ollenkaan -- halutut kirjaimet tulevat kyllä mutta moneen kertaan ylimääräisten merkkien kera (käli käyttää QT:ta ja sillä lienee jotain tekemistä asian kanssa)
- ChatZilla: Japanin kirjoitus toimii täydellisesti, mutta merkistökoodaukseen on vain yksi globaali asetus. Ei siis toimi yhtaikaa latin1:tä kaipaavilla kanavilla/verkoissa
-- Alex Grönholm
Oletko kokeillut ChatZillaa? --MarkusKoivisto
mIRC "ongelma" on feature yhdessä scriptin variaatiossa. Enemmän löytyy http://www.acko.net/blog/utf-8-mirc], kuten myös molempiin suuntiin muuntava scripti. (disclaimer: en testannut.)
Mistä lähtien irkissä ja varsinkin go.fi:llä on vallinnut demokratia? Mikä oli se taho, joka antoi oikeuden järjestää äänestyksen ja määrätä tarvittavan enemmistön koon? Mielipiteitä saa toki kysyä, mutta se joka yrittää järjestää jotain kansanvaltaa perinteisesti ja teknologisesti diktatuuriin perustuvaan anarkiaa tavoittelevaan systeemiin, olkoon tuomittu näkemään skandinsa lokinkuvina hamaan maailmanloppuun asti.
Täten määrään, että utf-8:aa saa aivan vapaasti käyttää, eikä siitä syystä tule ketään kanavalta potkittaman. Lisäksi määrään myös, että ne jotka eivät utf-8:a syystä tai toisesta hyväksy, käyttäkööt ignorea tai poistukoot paikalta. Tämä määräys on voimassa heti. Valitukset asiasta voi jättää esittämättä.
-Bass, anarkian dikstaattori, ignore-option käyttäjä.
Tdmd selvd. Harmittaa vaan joutua ignoraamaan ihmisid kun ne puhuu sotkua. -Phalla
Höps. Saa sitä nyt yleistä mielipidettä kysyä, koska ainakin henk. koht. kypsähdin kuuntelemaan jatkuvaa wtf-nillitystä kanavalla. Tämän jälkeen on ainakin jonkinasteinen konsensusmielipide olemassa, ja tälle sivulle voi viitata kun keskustelu alkaa taas käydä jossain vaiheessa. Minua ei oikeasti kiinnosta kuka käyttää mitäkin, kunhan vain jankhaus loppuu. Nuo keskustelut kun käydään aina perstuntumalla: "ei kukaan oikeasti halua siirtyä utf-8:aan" ja "ei ihmiset, jotka osaa konffata itselleen gentoo-linuxin tai debianin, voi kerta kaikkiaan osata asentaa yhtä skriptiä irssiin."
Siksi äänestys. Saadaan edes jonkinlaista dataa asiasta.
Noraaminen on tylsää, koska jos on aktiivinen ihminen niin moni keskustelun tynkä on entistäkin käsittämättömämpää.
-- JariKoivikko
Onhan se tylsää joo. Toisaalta, ignoreen ei tarvitse laittaa kuin ne, joiden mielestä toimiva systeemi on huono idea ja palaavat mieluummin "hei miten ma saan mun skandit toimimaan" -kulta-ajalle.
-- Bass
Etkö ole vielä hoksannut, että tämä on vihoviimeinen kerta, kun meidän tarvitsee vaihtaa merkistöä? Ensin oli vain US-ASCII. Sitten tuli 7-bittinen merkistö, jonne oli ängetty ääkköset mm. eräitten sulkeitten tilalle. Sitten tuli 8-bittiset merkistöt johon ääkköset ja kasa aksenttimerkkejä mahtui jo kivuttomasti, mutta esim. suomen ja japaninkielen merkkien yhtäaikainen käyttö ei onnistunut. Mutta nyt siis on tarkoitus siirtyä UTF-8:aan, jolla pärjätään niin pitkälle tulevaisuuteen, ettei tämän jälkeen enää ikinä tarvitse tehdä siirtymistä merkistöstä toiseen. Tästä siirtymäajasta on vaan päästävä jotenkin yli ja sen aikana skandit toki ovat rikki tai ”rikki” riippuen siitä, minkä merkistön suunasta asiaa katsoo ja mikä merkistö katsotaan ”oikeaksi” ja mikä ”vääräksi”. Mutta onhan se todella ikävää, kun jotkut takapajuiset tyypit antavat ymmärtää, että siirtyminen URF-8:aan olisi ”skandien rikkomista” ja pysyminen jossain suppeissa 8-bittisissä merkistöissä olisi muka ”skandien korjaamista”. -- Juhtolv
- UTF-8:sta saatava hyöty on vähintäänkin kyseenalainen, varsinkin kun japania puhuvat ohjataan melkein poikkeuksetta #japani.fi -kanavalle.
- HYVIN suurella osalla (ainakin 70% kanavan väestöstä), siirtyminen on tällä hetkellä mahdotonta tai melko helvetin hankalaa. m-IRCille löytyy vain plugineja jotka toimivat niin ja näin. Fontit saa hakea itse. Ne meistä, jotka käyttävät shellipalvelujen irssiä (tjsp) eivät ole saamassa pitkään, pitkään aikaan mahdollisuuttakaan käyttää sitä. Riippumatta mitä yksityishenkilöt tekevät ja luulevat, suurille palvelimille ei asenneta unstable irssiä paketinhallinnan ohi.
- Niille, joilla UTF-8 jo toimii ei ole mikään ongelma kääntää sitä pois yhdelle kanavalle.
- Enpä voi sanoa tukevani kovin tehokkaasti standardia, joka ei ole alaspäin yhteensopiva.
Ja mistä lähtien ihmisiä on edes potkittu utf-8:n päällä olemisesta? Itse olen maininnut useille ihmisille että skandit kuntoon, ja yleensä on nopeesti mennyt. En ole tainnut kertaakaan nähdä kenenkään saavan saapasta sen takia. Olen myös irkannut melko ahkerasti monissa irkkiverkoissa, eikä vastaan ole tullut vielä yhtään vähänkään julkisempaa kanavaa, jolla UTF-8 olisi jo "oletus". Äänestyksen perusteet ja oikeutus tuntuvat hyvin haparoilta.
-- Markus Hietava