Ettei koko ajan tarvitsis tapella merkist�ist�, ehdotan, ett� #go.fi -kanavalla siirryt��n kertaheitolla UTF-8 -merkist��n, esim. 1.4.2006. K�yt�nn�ss� t�m� tarkoittaisi sit�, ett� nykyk�yt�nn�st�, jossa nuristaan, kun ihmiset huutavat UTF-8:aa kanavalle, siirryt��n k�yt�nt��n, jossa nuristaan, jos kanavalle tuotetaan jotain muuta kuin UTF-8 -merkist��.
Hyvi� syit� siirtoon:
- Ei en�� merkist�tappeluita (as if)
- Japaninkielisi� merkkej� voi heitt�� tekstin joukkoon (go kuitenkin on it�maalainen peli, joten t�m� on jossain m��rin perusteltua)
- UTF-8 on standardi, ja monet muut kanavat ovat siirtyneet jo siihen. T�m� parantaa yleist� maailman harmoniaa ja tekee paremman muodon.
- UTF-8 on p��asiallisesti englantia puhuvissa serveriverkoissa (esim. freenode) jo oletus.
Syit� olla siirtym�tt�:
- mIRC-klientin k�ytt�j�t joutuvat lataaman ulkopuolisen tekij�n skriptin ja ajamaan kaksi rivi� komentoja.
- irssi� ainakin Debianissa tai Gentoossa k�ytt�v�t joutuvat asentamaan uuden asiakkaan vakaan jakelun ulkopuolelta tai kolmannen osapuolen skriptin.
- Edelliset aiheuttavat turhaa ja hankalaa s��t�� varsinkin niille jotka eiv�t ole j�rin perehtyneit� tietotekniikan syviin saloihin tai eiv�t yll�pid� itse omia irkkikoneitaan.
- Nyt k�ytetyt ISO 8859-1 ja -15 ovat standardeja ja niill� on laaja ja kyps� tuki takanaan. Monet IRC-kanavat k�ytt�v�t niit�.
��nest�k�� alle (koskee vain IRCiss� huutelevia). ��nestys uusitaan noin puolen vuoden v�lein, kunnes enemmist� on samaa mielt� kuin min�.
Mik�li ��nestyksen tulos on negatiivinen, niin utf-8:aa kanavalle suoltavat saa potkia vapaasti pois (kun ensin on viitattu t�lle sivulle).
Viimeinen ��nestysp�iv� on 31.1.2006. ��nest�m�tt� j�tt�neet lasketaan "ei v�li�" -��niksi. Mik�li v�hint��n puolet annetuista ��nist� on puolesta, kanavan merkist�koodaukseksi muuttuu UTF-8 1.4.2006.
��nestys 1H2006#
Puolesta (21): JanneJalkanen MarkusKoivisto LauriPaatero JariLepp�nen Juhtolv MarkusRunonen Tapio Vuorinen AnssiMattus Pekka Wallendahl Mika Urtela Juho Pennanen Hannu-Pekka Rajaniemi Alex Gr�nholm Ilkka Mattila hena TeemuHirsim�ki Anssi Voutilainen Veikko Nurmonen Joona Kinnunen Antti Holappa Miika Ginman Joel Yliluoma
Vastaan (15): JariKoivikko Ilkka Virta JanneNikula Toni Nisumaa Markus Hietava Ville Pietarinen Ville Rantala Mikael Runonen Veikko Horstia Olli Lounela Markku Jantunen Jesse Savo Maunu Tuomainen seku Suvi MiikaNikula
Ei v�li�: Paavo Pietarila Joakim Bj�rkgren
Tiivistelm� allaolevasta keskustelusta #
Tiivistelm�n teki Bass, joka ei erityisemmin viitsinyt kiinnitt�� huomiota siihen, tulivatko kaikkien mielipiteet tasapuolisesti esitetyiksi. Pahoitteluni, jos olen tulkinnut jotakuta v��rin tai j�tt�nyt erityisen t�rke�n pointin huomiotta, saa korjata. Koitin jaotella argumentit kutakuinkin mielipiteisiin ja sellaisiin, joiden voi olettaa olevan suurella varmuudella faktaa.
Mielipiteit�:
- Iso-latinin k�ytt� voi hyvin jatkua, mutta utf-8 aiheinen kitin� sit� k�ytt�ville voisi loppua. (Markus Koivisto, my�hemmin voimallisemmin my�s Bass)
- utf-8:iin siirryt��n kuitenkin joskus, miksei heti? (Markus Koivisto)
- Joka osaa utf-8-tuen klienttiins� asentaa, osaa my�s sen k��nt�� pois #go.fi:ll�. (Markus Hietava)
- #go.fi ei tarvitse japaninkielisi� merkkej� (Jari Koivikko) eik� pelkk� utf-8:n k�ytt� saisi niit� toimimaan ainakaan mirkiss� (Alex Gr�nholm) eik� miss��n muuallakaan. (Bass)
- V�ite, jonka mukaan monet muut kanavat ovat jo siirtyneet utf-8:aan, on tuulesta temmattu (Falla, Markus Hietava, Juhtolv:n esitt�m� tilasto)
- Muutkaan yll�mainituista perusteluista utf-8:n puolesta eiv�t ole p�tevi�. (Bass)
- Ennen kuin on olemassa kunnolliset ohjeet jokaikiselle klientille, on turha yritt�� muutosta. (DonOlli)
- M� vaan tykk��n UTF-8:sta niin paljon (Antti Holappa)
Faktaa:
- On olemassa klientti, irssi 0.8.10, jossa on hyv� utf8-tuki. (konsensus)
- My�s x-chat, colloquy, jotkin aikaisemmat irssin versiot ja muutamat muut clientit tukevat utf-8:aa (Markus Koivisto)
- Tilaston mukaan yli 50% kanavalaisista joutuisi tekem��n v�hint��nkin jonkinlainen asennustoimenpiteen (Tilasto: Janne Jalkanen, tulkinta: Bass)
- Windowsille saatavilla olevat vaihtoehdot eiv�t testattaessa olleet kelvollisia. (Alex Gr�nholm, Falla)
- utf-8:n j�lkeen ei tarvitse en�� vaihtaa merkist�koodausta, koska se osaa esitt�� kaikki kuviteltavissa olevat merkit. (Juhtolv)
- Japania puhuville suomalaisille goonpelaajille on jo perustettu kanava, jossa k�ytet��n utf-8:aa, #japani.fi (Jari Koivikko)
- Latin-koodausta k�ytet��n muutamaa poikkeusta lukuunottamatta kaikilla suomea puhuvilla kanavilla. Jokainen tunnettu klientti tukee sit�. (Bass)
Satunnaista keskustelua#
Pyyt�m�tt� kommentoin alkup. tekstin kirjoittajalle ett� v�itteet muotoa "monet kanavat ovat..." voi my�s perustella, esim. listaamalla kanavat tai muuten. T�� tekee v�itteest� paremman. -Ilkka
Kas t�ss� monien muitten kanavien tilanne: http://wiki.tukaani.org/utf-8_ja_irc-kanavat -- Juhtolv
Olen periaatteesta tukemassa t�t�, mutta voipi olla, ett� jos ihmett� ei tapahdu ja irssin 0.8.10 -versio ilmesty Debianin stableen niin joudun s��t�m��n itselleni uuden irc-shellin, ja joo ei tahdo sorsatkaan k��nty�. :/ -Pekka
- backports.org:ista n�ytt�isi l�ytyv�n irssin 0.8.10 -portti debian stablelle. En tosin ole testannut. --JanneJalkanen
Toi backports.org:ista otettu irssi 0.8.10 on jo muutaman p�iv�n ollut koneessa wildeast.cc.jyu.fi, jossa on Debianin stable-versio ja hyvin n�ytt�� toimivan. -- Juhtolv
Syit� vastaan: http://stnz.fi/anti-utf8/
Satiiri tms. edellisest�: http://johan.kiviniemi.name/stuff/anti-8bit -- Juhtolv
Itse olen sit� mielt� ett� iso-latinin k�ytt� voi hyvin jatkua, mutta ett� utf-8 aiheinen kitin� sit� k�ytt�ville voisi loppua. Merkist�v��nn�t alkavat pikkuhiljaa kyll�stytt��: loppujen lopuksi kysymys on koska utf-8:aan siirryt��n, eik� siirryt��nk�. Miksei siis siirrytt�isi nyt? On turhaa antaa yhden klientin (t�ss� tapauksessa viittaan mIRC-klienttiin) pit�� muita panttivankina, varsinkin kun siihenkin klienttiin on olemassa kolmannen osapuolen tarjoama tuki merkist�lle. - MarkusKoivisto
Ehdotuksen kohtaa "siirryt��n k�yt�nt��n, jossa nuristaan, jos kanavalle tuotetaan jotain muuta kuin UTF-8 -merkist��" voisi olla hyv� tarkentaa. Laajasti tulkiten sen voi ymm�rt�� esimerkiksi j�rjestelm�lliseksi latin1-k�ytt�jien potkimiseksi pois kanavalta mutta toisaalta sen voisi ymm�rt�� my�s maltillisesti latin1:n k�yt�n jatkumiseen utf-8:n rinnalla. Koska n�iden v�lille j�� aika iso k�yt�nn�n ero, asiaa voisi olla hyv� tarkentaa. Varsinkin minua kiinnostaa, miten esimerkiksi lyhyit� ensivierailua tekevi� aloittelevia gon pelaajia aiotaan t�ss� suhteessa kohdella. Potkut sellaisessa tilanteessa nimitt�in olisivat aika raju veto ja tuskin antaisivat kovin hyv�� kuvaa Suomen go-harrastajista. -JanneNikula
Tarkoitin asian niin, ett� t�ll� hetkell� utf-8:aa suoltaville huudetaan "korjaa klienttisi", niin vaihdetaan toisinp�in... Tokko sielt� ket��n potkitaan ulos (paitsi niit�, jotka jatkuvasti jaksavat valittaa siit�, ett� miksi tehtiin niin ja n�in ja miksei jo siirryt� utf-8:aan tai latin9:��n tai macromaniin tai what ever). Sodat eiv�t kiinnosta ket��n, ja t�m�n j�lkeen ainakin on olemassa jonkinasteinen konsensus asialle. Sen j�lkeen valittajille voidaan n�ytt�� wikisivu, ja k�ske� keskittym��n johonkin oleelliseen. -- JanneJalkanen
Oleellista on my�s, ett� kuinka moni voi halutessaan siirty�. Esim he jotka ainoastaan joltain koululta irkkaavat eiv�t yleens� m��r�t� mit� versiota k�ytet��n. Esim TKK:n niksulassa on t�ll� hetkell� irssist� versio 0.8.9. Siihen sai kai jotenkin s��detty� skriptin, joka tukee riitt�v�sti, mutta kaikki eiv�t v�ltt�m�tt� osaa tai pysty. Suurin osa ei osaavista on yleens� yll�pidon armoilla jo senkin suhteen mit� clientti� k�ytet��n. T�m�n takia olisi mukava tiet�� kuinka suurelle osalle siirtyminen on a)triviaalia b)mahdollista c) mahdotonta. -- JariKoivikko
Jos k�yt�ss� on edell�mainittu irssi 0.8.9, siirtyminen on triviaalia. Vaikea uskoa ett� TKK:lla ei ole perl-tukea k�yt�ss� lainkaan, ja jos se kerran on, niin recode-ion ja muut skriptipohjaiset ratkaisut tarjoavat kaiken vaadittavan. Jos k�yt�ss� on mIRC, siirtyminen on triviaalia - se vaatii yhden skriptin lataamisen ja k�ynnist�misen. Jos k�yt�ss� on x-chat, siirtyminen on triviaalia. Jos k�yt�ss� on vanha ircII tai vastaava, siirtyminen on mahdollista, mutta vaatii locale-vaihdoksen. -- Markus Koivisto
Itseasiassa jo irssi v.0.8.6 osasi UTF-8:n, ilmeisesti localen kautta, mutta vasta v0.8.10:ss� tuli sis��nrakennettu recode-tuki ja muitten viesteiss� k�ytettyjen merkist�jen autodetectointi. charsetwars.pl puolestaan on vanhemmille irsseille tarkoitettu skripti, jolla se tunnistaa muitten k�ytt�mi� merkist�j� ja konvertoi niit�. Jos hengaa vain UTF-8-kanavilla, niin voi pist�� vanhemmankin irssins� UTF-8:aa k�ytt�m��n. -- Juhtolv
Kannattaa lukea kommentteineen p�ivineen my�s n�m� mieluummin ennen ��nestyst�. Tosin voi kai sit� ��nt��n vaihtaa ennen deadline�, jos muutti mielt��n: http://wiki.tukaani.org/keskustelu:irc_ja_utf-8 http://wiki.tukaani.org/irc_ja_utf-8 -- Juhtolv
Windowsissa utf-8:aan siirtymist� on nyt tullut testattua. Kokeilin kolmea clienttia, ja tulokset eiv�t ainakaan toistaiseksi vakuuta. N�in siin� k�vi:
- mIRC: skriptill� n�kee utf-8:aa mutta antaa edelleen ulos cp-1252:ta eli ei kelpaa, japanin kirjoitus ei tuettu
- X-Chat: Ei natiivi win32-ohjelma (k�li k�ytt�� GTK+:aa), josta aiheutuu ongelmia mm. japania kirjoittaessa (teksti ilmestyy aivan muualle kuin sy�tt�ruutuun)
- Kvirc: Japanin kirjoitus ei toiminut ollenkaan -- halutut kirjaimet tulevat kyll� mutta moneen kertaan ylim��r�isten merkkien kera (k�li k�ytt�� QT:ta ja sill� lienee jotain tekemist� asian kanssa)
- ChatZilla: Japanin kirjoitus toimii t�ydellisesti, mutta merkist�koodaukseen on vain yksi globaali asetus. Ei siis toimi yhtaikaa latin1:t� kaipaavilla kanavilla/verkoissa
-- Alex Gr�nholm
Oletko kokeillut ChatZillaa? --MarkusKoivisto
mIRC "ongelma" on feature yhdess� scriptin variaatiossa. Enemm�n l�ytyy http://www.acko.net/blog/utf-8-mirc, kuten my�s molempiin suuntiin muuntava scripti. (disclaimer: en testannut.)
Mist� l�htien irkiss� ja varsinkin go.fi:ll� on vallinnut demokratia? Mik� oli se taho, joka antoi oikeuden j�rjest�� ��nestyksen ja m��r�t� tarvittavan enemmist�n koon? Mielipiteit� saa toki kysy�, mutta se joka yritt�� j�rjest�� jotain kansanvaltaa perinteisesti ja teknologisesti diktatuuriin perustuvaan anarkiaa tavoittelevaan systeemiin, olkoon tuomittu n�kem��n skandinsa lokinkuvina hamaan maailmanloppuun asti.
T�ten m��r��n, ett� utf-8:aa saa aivan vapaasti k�ytt��, eik� siit� syyst� tule ket��n kanavalta potkittaman. Lis�ksi m��r��n my�s, ett� ne jotka eiv�t utf-8:a syyst� tai toisesta hyv�ksy, k�ytt�k��t ignorea tai poistukoot paikalta. T�m� m��r�ys on voimassa heti. Valitukset asiasta voi j�tt�� esitt�m�tt�.
-Bass, anarkian dikstaattori, ignore-option k�ytt�j�.
Tdmd selvd. Harmittaa vaan joutua ignoraamaan ihmisid kun ne puhuu sotkua. -Phalla
H�ps. Saa sit� nyt yleist� mielipidett� kysy�, koska ainakin henk. koht. kyps�hdin kuuntelemaan jatkuvaa wtf-nillityst� kanavalla. T�m�n j�lkeen on ainakin jonkinasteinen konsensusmielipide olemassa, ja t�lle sivulle voi viitata kun keskustelu alkaa taas k�yd� jossain vaiheessa. Minua ei oikeasti kiinnosta kuka k�ytt�� mit�kin, kunhan vain jankhaus loppuu. Nuo keskustelut kun k�yd��n aina perstuntumalla: "ei kukaan oikeasti halua siirty� utf-8:aan" ja "ei ihmiset, jotka osaa konffata itselleen gentoo-linuxin tai debianin, voi kerta kaikkiaan osata asentaa yht� skripti� irssiin."
Siksi ��nestys. Saadaan edes jonkinlaista dataa asiasta.
Noraaminen on tyls��, koska jos on aktiivinen ihminen niin moni keskustelun tynk� on entist�kin k�sitt�m�tt�m�mp��.
-- JariKoivikko
Onhan se tyls�� joo. Toisaalta, ignoreen ei tarvitse laittaa kuin ne, joiden mielest� toimiva systeemi on huono idea ja palaavat mieluummin "hei miten ma saan mun skandit toimimaan" -kulta-ajalle.
-- Bass
Etk� ole viel� hoksannut, ett� t�m� on vihoviimeinen kerta, kun meid�n tarvitsee vaihtaa merkist��? Ensin oli vain US-ASCII. Sitten tuli 7-bittinen merkist�, jonne oli �ngetty ��kk�set mm. er�itten sulkeitten tilalle. Sitten tuli 8-bittiset merkist�t johon ��kk�set ja kasa aksenttimerkkej� mahtui jo kivuttomasti, mutta esim. suomen ja japaninkielen merkkien yht�aikainen k�ytt� ei onnistunut. Mutta nyt siis on tarkoitus siirty� UTF-8:aan, jolla p�rj�t��n niin pitk�lle tulevaisuuteen, ettei t�m�n j�lkeen en�� ikin� tarvitse tehd� siirtymist� merkist�st� toiseen. T�st� siirtym�ajasta on vaan p��st�v� jotenkin yli ja sen aikana skandit toki ovat rikki tai �rikki� riippuen siit�, mink� merkist�n suunasta asiaa katsoo ja mik� merkist� katsotaan �oikeaksi� ja mik� �v��r�ksi�. Mutta onhan se todella ik�v��, kun jotkut takapajuiset tyypit antavat ymm�rt��, ett� siirtyminen UTF-8:aan olisi �skandien rikkomista� ja pysyminen jossain suppeissa 8-bittisiss� merkist�iss� olisi muka �skandien korjaamista�.
-- Juhtolv
- UTF-8:sta saatava hy�ty on v�hint��nkin kyseenalainen, varsinkin kun japania puhuvat ohjataan melkein poikkeuksetta #japani.fi -kanavalle.
- HYVIN suurella osalla (ainakin 70% kanavan v�est�st�), siirtyminen on t�ll� hetkell� mahdotonta tai melko helvetin hankalaa. m-IRCille l�ytyy vain plugineja jotka toimivat niin ja n�in. Fontit saa hakea itse. Ne meist�, jotka k�ytt�v�t shellipalvelujen irssi� (tjsp) eiv�t ole saamassa pitk��n, pitk��n aikaan mahdollisuuttakaan k�ytt�� sit�. Riippumatta mit� yksityishenkil�t tekev�t ja luulevat, suurille palvelimille ei asenneta unstable irssi� paketinhallinnan ohi.
- Niille, joilla UTF-8 jo toimii ei ole mik��n ongelma k��nt�� sit� pois yhdelle kanavalle.
- Enp� voi sanoa tukevani kovin tehokkaasti standardia, joka ei ole alasp�in yhteensopiva.
Ja mist� l�htien ihmisi� on edes potkittu utf-8:n p��ll� olemisesta? Itse olen maininnut useille ihmisille ett� skandit kuntoon, ja yleens� on nopeesti mennyt. En ole tainnut kertaakaan n�hd� kenenk��n saavan saapasta sen takia. Olen my�s irkannut melko ahkerasti monissa irkkiverkoissa, eik� vastaan ole tullut viel� yht��n v�h�nk��n julkisempaa kanavaa, jolla UTF-8 olisi jo "oletus". ��nestyksen perusteet ja oikeutus tuntuvat hyvin haparoilta.
-- Markus Hietava
Nillin nillin. T�m� ��nestys on t�ss� siksi, ett� jos sit� ei tehd�, niin asiasta jahkataan hamaan tulevaisuuteen saakka UTF-8:n puolustajien ja vastustajien v�lill�. Min� despoottisesti p��tin (jo ennen Bassin esimerkki�), ett� t�m� on demokratia. :)
Ihmisi� on potkittu kanavalta siit�, ett� he ovat nillitt�neet siit�, miksei kanavalla kaikki k�yt� UTF-8:aa, ei siit�, ett� he ovat k�ytt�neet UTF-8:aa.
Suoritin pikaisen laskennan:
- mIRC: 42 kpl
- irssi 0.8.10: 50 kpl
- irssi 0.8.9: 35 kpl
- irssi 0.8.6 tai .4: 4 kpl
- xchat: 4 kpl
- Colloquy, eggdrop, ircii, Yowsa: 1 kpl
Yhteens� siis 139 kpl (+botit). N�ist� noin 56 kpl (eli 40%) on jo t�ysin UTF-8 -valmiita (uusin irssi, xchat, Colloquy tai eggdrop [taitaa tosin olla botti]. Yowsasta en tied� mit��n). Triviaalilla skriptin lis�yksell� tai clientin p�ivityksell� p�rj��v�t irssin 0.8.9-version k�ytt�j�t (25%), joka nostaa UTF-8:n kanssa p�rj��v�t luokkaan 65% eli liki 2/3 enemmist�ksi. Osa vanhan irssin k�ytt�jist� saattaa olla tilanteessa, jossa p�ivitys ei onnistu, mutta ainakin omalta kohdaltani p�ivitys on melko triviaali. Suurin osa irsseist� n�ytt�isi jopa py�riv�n Linuxin p��ll�, mik� vihjaisi, ett� ne ovat kotikoneita.
Joten tuo 70% arviosi on t�ysin hihasta ravistettu, eik� pohjaudu todellisuuteen. V�it�n, ett� suurimmalle osalle #go.fi:n k�ytt�jist� t�m� ei aiheuta mink��nasteisia ongelmia. Osalle kyll� varmasti, mutta niin aiheuttaa my�s jatkuva asiasta mutu-tuntumalla v��nt�minen.
-- JanneJalkanen
Itkemisest� siit�, ett� kaikkien pit�isi k�ytt�� UTF-kasia voikin jo potkia. Eli korjaan, syyt o(li)vat vain huonosti listattu. mIRC:n k�ytt�ji� voi olettaa helposti olevan kaksinkertainen m��r� tai ainakin puolet lis�� kotik�ytt�ji�, puhumattakaan uusista tulokkaista. Linuxin p��ll� ajava irssi ei v�ltt�m�tt� sano mit��n. N�m� asiat mukaanluettuna listaasi luku kiipe�� helposti yli 70%. Eli vaikka luku perustui l�hinn� perstuntumaan, ei se kovin v��r�ss� olisi.
Ja viimeiseksi, tuo "triviaali skriptin lis�ys tai clientin p�ivitys" ei todellakaan ole triviaalia. Jos se olisi triviaalia, suuri osa (min� mukaanluettuna) olisimme jo UTF-8-kelpoisia. Eik� sit� mill��n "mutu-tuntumalla" v��nnet�, vaan periaatteella ASCII-sotkua on vittumaista lukea, ja UTF-8-kelpoiselle ei ole mik��n ongelma vain olla pist�m�tt� sit� p��lle. Kunhan uusi mIRC ja irssin vakaa 0.8.10 tulevat ulos niin t�st� voidaan oikeasti keskustella. Siihen asti t�m� on vain pikkuasioista v�ittely� (nuo 42 mirkin k�ytt�j�� voitaisiin muuten olettaa 'ei'-��niksi, jos tarkkoja ollaan:P). Suosittelenkin yh�, ett� UTF-8-fanaatikot vain purevat hammasta siihen asti ja kest�v�t skandeilla puhumista kun nyt skandinaviassa ollaan. :P Ette te tarvi sit� UTF-kasia mihink��n #go.fi:ll�, relatkaa.
-- MarkusHietava
Lainattua sivun yl�laidasta:
"UTF-8 on standardi, ja monet muut kanavat ovat siirtyneet jo siihen. T�m� parantaa yleist� maailman harmoniaa ja tekee paremman muodon."
Standardejahan maailmassa riitt��. Min� olen aktiviisesti 14 kanavalla, ml. #go.fi ja yksik��n noista ei ole vaihtanut UTF-8:ksi. Eik� yhdell�k��n muulla kanavalla ole mit��n hinkua vaihtaakaan. Mik� ihmeen kiire #go.fill� on olla tienn�ytt�j�n�? Ymm�rr�n kyll� syyt, miksi olisi eritt�in hyv� jos kaikki suoltaisivat uutta standardia, mutta kun t�m� vaan ei ole kaikille mahdollista. Onko olemassa joku Painava Syy, mink� takia t�ll�kin hetkell� kanavalle pit�isi hyv�ksy� sellaisia merkkej�, jotka n�kyv�t melko suurelle osalle k�ytt�jist� sotkuna? Eik� voitaisi ihan oikeasti odottaa siihen asti, ett� siirtyminen on mahdollista kaikille? Ja jos demokratiasta(kin!!) t��ll� on p��sty puhumaan niin milt� teist� tuntuisi sellaisen presidentin valinta, jolla on takanaan 12% ��nist�? (kyll�-��net jaettuna varsin maltillisella 130:ll�)
-- Falla
"Kunhan uusi mIRC ja irssin vakaa 0.8.10 tulevat ulos niin t�st� voidaan oikeasti keskustella."
Olen samaa mielt�. Irssin vakaa 0.8.10 on tosin tullut ulos, ja uutta mIRC-versiota ei ole tulossa, joten eik� ole jo oikean keskustelun paikka?
"Ja jos demokratiasta(kin!!) t��ll� on p��sty puhumaan niin milt� teist� tuntuisi sellaisen presidentin valinta, jolla on takanaan 12% ��nist�? (kyll�-��net jaettuna varsin maltillisella 130:ll�)"
Kuullostaa demokratialta. ��nestysaktiivisuuden puute on nukkuvien puolueen h�pe�. Edelleenkin, kyse ei ole siit�, vaihdetaanko ikin� unicodeen. Kyse on siit�, koska vaihdetaan. -- MarkusKoivisto
T�st�h�n ei itse asiassa ole keskusteltu, ett� mit� tapahtuu, jos UTF-8:aan p��tet��n siirty�. Ehdottaisin, ett� kanavan virallinen koodaus on UTF-8, mutta Latin1:t� siedet��n siiheksi, kunnes ihmiset ovat luopuneet mIrcist�... (josta en my�sk��n jaksa uskoa, ett� olisi tulossa uutta versiota ikin�.)
Ja mit� ihmett� voi tarkoittaa "mIRC:n k�ytt�ji� voi olettaa helposti olevan kaksinkertainen m��r�"? Min� laskin ne. Niit� on just niin paljon kuin niit� on.
Sivustakatsojan huomioita: kyll�styin katselemaan �l�m�l�� ja k��nsin sitten itse (Oulun) tuomeen irssi 0.8.10:n. Nyt n�kyy merkit ihmisten tavalla ja oikeastaan on aivan sama, puhutaanko kanavalla wanhaa merkki� tahi uu-tee-�ff��. Jatkakaa toki rakentavaa keskustelua, m�� vaan juon ja irssaan.
Windows koneet suljetaan melko s��nn�llisesti k�yt�n j�lkeen toisin kuin *nix maailmassa ja mIRC ei taida my�sk��n py�r�hdell� screeniss�. Kaikilta ei voi my�sk��n olettaa, ett� osaavat k��nt�� tuoreen irssin tai s��t�� jotain tukevia paketteja ja plugineita. Tosiasia on vaan etteiv�t kaikki ole ohjelmistoalan ammattilaisia vaan meit� on siunattu laaja-alaisuudella. Kaikki oppilaitosten koneilta irkkaavat eiv�t my�sk��n kykene vaikuttamaan mit� softaversioita on tarjolla ja usein ei ole oikeuksia tehd� vaikka osaisi. Henkkohtaisesti osaan kyll� muuttaa sitten kun on se aika mutta v�hemm�n osaavien tai kykenevien sortamista en hyv�ksy. Siit� vastustus.
- go.fi ei my�sk��n tarvitse mihink��n oikeasti. Niit� kirjoitusmerkkej� osaa vain pieni osa eli muut eiv�t kuitenkaan ymm�rr� mit� tarkoittaa. T�t� varten perustettiin #japani.fi aikoinaan, ett� it�maisten kielten harrastaminen ei sotkisi go-kanavaa. Ne kolme kielt� (suomi,ruotsi,englanti), joita puhutaan kanavalla, sujuvat kyll� melkein mill� tahansa merkist�ll�. Go-termeihin viitataan jatkossakin romanisoiduilla versioilla, sill� niill� suurin osa k�sittelee asioita ja niit� enemmist� voi ymm�rt��.
Her�� sitten kysymys: miksi ylip��t�ns� siirrytiin pois iso-646-10:st�? Ruotsi, suomi ja englanti sujuvat sill�kin vallan mainiosti, eik� varsinkaan #go.fi:ll� kukaan tarvitse mit��n \- merkkej� saati aaltosulkuja, ja iso-latin n�ytt�� vanhojen klienttin silmiss� kutakuinkin tdltd. Vastaus t�h�nkin on varsin yksinkertainen - iso-latinista tuli oletus ja klientit joissa ei ollut mink��nn�k�ist� tukea sille yksinkertaisesti katosivat. Maailma on pullollaan kypsi� klienttej� joissa on unicode-tuki. mIRC-k�ytt�j�t eiv�t tosin suostu edes asentamaan kilkett� joka tekisi heid�n p��asiallisesta ongelmasta menneen talven lumia, vaan k�ytt�v�t mieluummin energiansa sitten asiasta napisemiseen. Kaksi rivi� on niin hankala kopioida ja liitt��. V�it�tk� todella, ett� mIRC k�ytt�j�t ovat niin tyhmi�, ettei moinen suju?
"Kaikilta ei voi my�sk��n olettaa, ett� osaavat k��nt�� tuoreen irssin tai s��t�� jotain tukevia paketteja ja plugineita." Onneksi irssi ei ole ainoa vaihtoehto. Jos uusimman irssin kuitenkin haluaa, eik� ole root, niin sen k��nt�minen on helppoa kuin:
wget http://irssi.org/files/irssi-0.8.10.tar.bz2
tar zxvf irssi-0.8.10.tar.bz2
cd irssi-0.8.10
./configure --prefix=$HOME/irssi
make
make install
N�m�kin tulevat ilmi kun lukee paketin INSTALL-tiedostoa. Onko t��ll� oikeasti joku, joka uskoo ettei tunne ket��n joka ei n�ill� ohjeilla saisi sit� k��nnetty�? Eih�n se vaadi mit��n muuta kuin leikkausta ja liimausta, mik� tuntuu sujuvan windows-k�ytt�jilt�kin varsin mutkatta. Niin heikosti osaavaa henkil��, etteik� tuon asennus sujuisi mutta screenin k�ytt� kyll�kin ei yksinkertaisesti ole olemassa.
Mielest�ni on naurettavaa aliarvioida k�ytt�ji� tuolla tapaa.
Ei ole aliarvioimista vaan sit� ett� tuntee ihmisi�. Kaikki eiv�t vaan osaa eiv�tk� v�ltt�m�tt� edes halua osata muuta kuin hiirell� naksuttelua asentamisen suhteen. T�m� mahdollisuus heille my�s suotakoon. Sitten kun on pakko, he voivat pyyt�� jonkun muun s��t�m��n itselleen toimivan ymp�rist�n, mutta toistaiseksi ei ole mik��n kiire siirtymisell�. Ohjeet n�ytt�v�t hyv�lt�. Vastaavat muillekin ja aletaan olla l�hemp�n� todellista siirtymismahdollisuutta. Tosin yhteisk�ytt�koneissa tuo ei ole kovinkaan suositeltavaa vaan mielummin yll�pidon kautta asennus.
Jos haluaa hiirell� naksuttelemalla asentaa itselleen graafisen ilmaisen klientin windowsille, se onnistuu k�ytt�m�ll� x-chatti�. Siin� ei varmastikaan tarvitse muitten apua. Kun encoding on lis�ksi viel� utf-8, se tunnistaa automaattisesti iso-8859-1 -enkoodatut rivit oikein. mIRCin utf-8 -konversio asennettiin seuraavalla tapaa:
- Lataa utf8.mrc hakemistoon C:\Program Files\mIRC (tai minne se nyt on asennettu.
- Kirjoita komentokentt��n
- /load -rs utf-8.mrc
- /loadcodepage 1252
T�ll� ei pysty n�ytt�m��n mit��n muuta kuin cp-1252 -merkkej�, joten mIRCin k�ytt�j�t j��v�t hieman paitsioon utf-8:n hy�typuolista.
N�ill� ohjeilla katettiin siis kaikki paitsi nelj� kanavan klienteist�. Eggdrop on merkist�agnostinen, Colloquy omaa x-chatin tavoin jo utf-8 -tuen, ja ircii:llekin on olemassa jo uusi versio (20050911) joka tukee utf-8 -rekoodausta. Akaisemmat versiot tukevat utf-8:a kun locale ja terminaali sit� k�ytt�v�t. Yowsasta en l�yd� mit��n tietoa t�ll� hetkell�.
T�ten on siis nyt t�ss� ohjeet jokaiselle klientille, jota t�ll� kanavalla k�ytet��n, Yowsaa lukuunottamatta.
Tuosta mIRC:lle olevasta scriptist� on enemm�n haittaa kuin hy�ty�. Kuten aiemmin mainittiin, ett� mIRC:n k�ytt�j�t j��v�t hieman paitsioon utf-8:n hy�typuolista. Todellakin, saavutettu hy�ty on nolla. Samainen kikkare vaatii toimiakseen enemm�n konffausta kuin tuon mainostetun kahden rivin verran. T�m�n lis�ksi skripti hajottaa joitakin mIRC:n toimintoja.
Lis�haittaa seuraa my�s siit�, ett� kun mIRC:n vaihtaa h�p�tt�m��n pelkk�� UTF-8:a niin ainakin minulla huomattavasti useampi kanava alkaa valittamaan sen k�yt�st� kuin mit� kanavilla valitetaan 1252:n k�yt�st�. Er��lt� kanavalta tulee my�s kenk�� persauksille UTF-8:sta.
Mielest�ni koko "ratkaisun" esittelyn tarkoitus on vaan saada mIRCin k�ytt�j�t pit�m��n turpansa kiinni.
-- Falla
Siis tuo skripti johon laitoin linkin ei muuta ulostulevaa teksti� utf-8:ksi. Taidat siis puhua jostain muusta. Se mit� tuo tekee, on ett� se muuttaa tietyt sis��ntulevat utf-8 merkit valitun codepagen merkeiksi. Koska mIRC ei sis�isesti k�yt� unicodea, j�� sill� unicoden hy�typuolet saavuttamatta. T�ll� virityksell� saa kuitenkin esimerkiksi utf-8 koodatut ��kk�set n�kym��n mIRCill�. Voisit mielell�si kertoa ett� mit� siihen tarvitaan niitten kahden rivin lis�ksi tai mit� toimintoja se rikkoo: itse en huomannut lyhyen testauksen aikana mit��n muuta kuin ett� @- ja +-merkit katosivat nikkien edest�.
T�ss� n�ytt�� olevan taas kerran kyse siit�, ett� jotkut haluavat v�kisin puskea jotain uutta ja heid�n mielest��n superhienoa, siit�kin huolimatta ett� se aiheuttaa muille ongelmia. Odottamalla jongin verran (esmes puoli vuotta tai vuoden, tai miksei pari vuotta) tilanne tasoittuu huomattavasti, kun tuki asialle kypsyy. Jos kerran kanavakohtainen utf-8 -tuki on helposti asetettavissa, mikseiv�t ne jotka omaavat niin hienon klientin voi sit� asettaa pois go.fi:lt�? Aina on helppo sanoa muille ett� tehk�� ku ois jo, mutta ei sitten osata ottaa huomioon ett� muilla ei ehk� ole aikaa sellaiseen -- puhumattakaan niist� jotka Gardan ottaa huomioon, jotka eiv�t ole ATK-ammattilaisia; heill� ei ei v�ltt�m�tt� ole osaamista.
Itse k�yt�n ircii:t�, joka lienee j��nyt Ecyrdin laskuista koska en ollut silloin linjalla. Sille ei tiet��kseni ole utf-8:aa tukevaa pakettia miss��n linux-jakelussa, enk� sit� paitsi aio vaihtaa jakelua vain sen takia. Syy sille ett� k�yt�n ircii:t� on se, ett� siin� on ollut viimeisen viiden vuoden aikana v�hemm�n turvaongelmia kuin irssiss�. Ja se ett� mink� tahansa uuden klientin konffaamiseen menisi enemm�n aikaa kuin meik�l�isell� on ollut siihen k�ytt��.
Lis�ksi, kuten kaikki Ubuntua kokeilleet tiet�nev�t, utf-8 on nykyisell��n jatkuva p��ns�rky koneiden v�lisess� kommunikaatiossa. Menee pitk� aika ennen kuin sen k�ytt� on yht� itsest��n selv�� kuin ISO-Latin-1 (tai -9) nyky��n. Siirtyminen ASCIIsta ISO Latiniin kesti sekin arviolta vuosikymmenen verran.
Niin kauan kuin ei ole kunnon ohjetta, siis sellaista joka on selke� my�s humanisteille ja poliiseille, siihen ett� miten kaikki klientit konffataan nopeasti ja vaivattomasti utf-8 -kuntoon, on mielest�ni huono idea ajaa sit�. Miksei joku niist�, jolle asia on niin syd�menl�heinen voi hoitaa asiaa kuntoon t�t� kautta? Eih�n siihen mene kuin aikaa ja vaivaa. (Huom: kannattaa varautua siihen, ett� joutuu selvitt�m��n my�s eri linux-jakelujen vaillinaisen utf-8 -tuen vaikutukset, eik� "vaihda jakelua" ole ratkaisu siihen.)
Natsimeininki ja sanelupolitiikka go.fi-kanavan uusmeiningeiss� on aika luotaanty�nt�v� ajatus. Ehk� sielt� nyt sitten halutaankin sulkea pois muut kuin ATK:ta osaavat ja ainaista viriviritt�mist� jaksavat?!?
-- DonOlli (joka ei mill��n jaksaisi n�it� ainaisia sotia)
Vaihtoehtoja mIRC-k�ytt�jille on noin kaksi. Ensin Ackosta l�ytyv� skripti
"The user sees and types regular ANSI characters, but all data which is sent to and received from the IRC server is UTF-8 encoded."
T�m�n lis�ksi kikkare maalaaa tekstej� punaiseksi.
ja sitten t�m� mm. tukaanista l�ytyv� Mikko Rauhalan skripti, joka on jo v�h�n enemm�n oikeaan suuntaan. T�m� skripti n�ytt�� tulevan UTF-8:n k�ytt�j�lle normaalina cp-1252:a, ja juttelee sit� takaisin serverille. Eik� v�rj�� tekstej� punaiseksi.
Molemmat yll�olevat rikkovat nuo aiemmin mainitut @ ja +-merkit, mink� korjaamiseksi pit�� skriptiin lis�t� lis�� pullaa (t�m�n takia tarvitaan lis�� sit� s��t��). T�m�n lis�ksi kanavaikkunan irrottaminen mIRCist� desktopille ja highlight-vilkkuminen yhdess� eiv�t toimi. Molemmissa on vikana ett� vain jompaa kumpaa saa sy�tetty� serverille p�in. Johan t�st� samasta on jauhettu, mutta tarve olisi todellakin pysty� erottelemaan merkit kanavakohtaisesti. Ja jos UTF-8:aan on tarkoitus siirty� #go.fill�, niin mit� j�rke� on asentaa skripti, joka h�p�tt�� muuta?
Muita vaihtoehtoja Windows-k�ytt�jille on asentaa tekstipohjainen klientti (graafisessa k�ytt�ymp�rist�ss� todella j�rkev��), asentaa XChat, joka on mIRCi� selv�sti heikompi ohjelma eik� varsinaisesti ratkaise alkuper�ist� ongelmaa, asentaa joku viel� huonompi ohjelma tai vaihtaa Linuxiin. Vaihtoehdot ovat kehnoja. Miksi t�m� hillit�n kiire...
--Falla
Falla, tuohon kysymykseesih�n on jo vastattu t�ll� sivulla. Kiire on koska:
- Ei en�� merkist�tappeluita (as if)
- Tosin go.fi:ll� on koskaan ollut 2 merkist�tappelua, japanilaisen bittim�ss�n puhujat vs. muu kanava, ja latin_1 vs. utf-8, joten perusteluna t�m� on luokkaa "anna mulle sun viikkorahat niin mun ei tarvitse kiusata sua".
- Japaninkielisi� merkkej� voi heitt�� tekstin joukkoon (go kuitenkin on it�maalainen peli, joten t�m� on jossain m��rin perusteltua)
- Tosin ne n�kyv�t edelleen bittim�ss�n� niille, joilla ei satu olemaan sopivia fontteja k�sill�, joten ainoa saatu korjaus on, ett� japanilaisen bittim�ss�n puhuminen muuttuu hyv�ksytt�v�mm�ksi. (minusta kukin saa puhua bittim�ss�� jos haluaa, minulla on ihan toimiva ignore jos se rupeaa minua �rsytt�m��n.)
- UTF-8 on standardi, ja monet muut kanavat ovat siirtyneet jo siihen. T�m� parantaa yleist� maailman harmoniaa ja tekee paremman muodon.
- Tosin latin_1 on standardi, johon Aivan Kaikki suomenkieliset kanavat ovat jo siirtyneet. T�m� ei tee hyv�� muotoa, vaan toimii. My�h�isempien aikojen irc-her�nn�isille muuten tiedoksi, ett� latin_1 ei ole taivaasta saatu lahja, vaan siihen siirryttiin kovalla ty�ll� ja kansanvalistuksella. Koska sill� oli kaikkien k�ytt�jien tuki takanaan, siirtym�vaihe kesti vain noin 7-8 vuotta.
- UTF-8 on p��asiallisesti englantia puhuvissa serveriverkoissa (esim. freenode) jo oletus.
- Tosin viimeksi katsoessani #go.fi ei sijainnut p��asiallisesti englantia puhuvassa serveriverkossa, vaan sellaisessa, jossa k�ytet��n jotain muuta merkist�� kuin asciita.
-- Bass
Ja n�m� perustelut ovat tarpeeksi hyv�t, ett� v�hint��n 40 kanavalla olijaa saa k�rsi� erilaisista ongelmista? Sen sijaan, ett� odotettaisiin hetki ja k�rsij�it� olisi v�hemm�n?
-- Falla
No ovat ovat, ainakin 18 kanavalaista on ihan omalla nimell��n allekirjoittanut tuonne ylemm�s, ett� n�in on asian laita.
--B
- UTF-8 on standardi, ja monet muut kanavat ovat siirtyneet jo siihen. T�m� parantaa yleist� maailman harmoniaa ja tekee paremman muodon.
T�m�n v�itteen alkuosalla ei ole muuten mink��nlaista painoarvoa. Ainoa tuki t�lle v�itteelle on tukaanin lista, josta l�ytyy muutamia kymmeni� kanavia, jotka k�ytt�v�t UTF-8:a tai ovat siirtym�ss� sille. IRCNetiss� on aika paljon enemm�n kanavia.
-- Falla
��nestin puolesta siit� huolimatta, ett� k�yt�n mircci�. M� vaan tykk��n UTF-8:sta niin paljon.
-- Antti
UTF-8 on kiva, mutta itselleni ei ole niin v�li�, irssi 0.8.10 recode for teh win.