Kodovani cestiny v mailu (dlouhe)
Luboš Kloc
kloc at ipm.cz
Mon Dec 22 10:42:36 CET 2003
Vit Brunner wrote:
> >> Nejde o rozpor se zákonem. Ale pĹ?ijde mi trošku neslušnĂŠ
> >> chtĂt po autorovi knihy, aby ztrácel ÄŤas zasĂlánĂm jejĂch
> >> částĂ (makro), kdyĹľ si to v tĂŠ knize mĹŻĹľe kdokoliv najĂt a
> >> opsat.
> >>
> >
> > Tak tohle se prima čte. Vím, že se na mou hlavu zase sesype hromada
> > výtek o instalaci češtiny, ale nechť.
> >
> > M. Balda
>
> Tak mne se teda Unicode cte asi stejne dobre jako ISO, jen se to nesmi
> michat v jednom mailu :)
>
> Tak bych se teda rad zeptal, jake kodovani se preferuje a vyhovuje
> vetsine, a jestli nekomu vadi psani bez hacku a carek.
>
> S pozdravem,
>
> V.
>
Zadne kodovani SE nepreferuje. Jednotlivi uzivatele site preferuji
ruzne pristupy. Dovolil bych si trochu obsahlejsi vyjadreni
z pozice pametnika :-)
E-mail je jedna z nejstarsich dosud pouzivanych sitovych sluzeb.
Puvodne byla koncipovana jen pro sedmibitovy ASCII kod
a osmibitove kododovane zpravy siti neprosly. Proto byly vyvinuty
a pouzivany ruzne metody prekodovani osmibitovych souboru
na sedmibitove - UU, XX, BinHex a konecne MIME, ktere dnes uz
v e-mailu zcela prevladlo a problemy s nekompatibilitou tohoto
prekodovani se vyskytuji uz jen vyjimecne.
Dalsim problemem je ale nejednota v kodovani cestiny. Nektera
kodovani uz sice take vypadla ze hry, ale stale zustavaji ve hre
CP1250, ISO-8852-2 a UTF-8. A take psani bez diakritiky, coz sice
neni z hlediska srozumitelnosti idealni, ale podstatne lepsi nez
text se zmrsenou diakritikou.
Jak tedy vnimam uziti ruznych kodovani a pristupu?
1) "Pisu cesky a nevim nic o tom, jak si s tim poradi pocitac a prijemce".
Z toho nejcasteji vyjde CP-1250. Jiste opravneny postoj laika, u uzivatelu
TeXu ale asi spis vyjimecny.
2) "Pouzivam CP-1250 nebo ISO-8859-2, protoze pisu adresetaum
pouzivajicim urcity specificky system (Windows, Linux ....)."
Logicke, ale v konferenci o TeXu nepouzitelne.
3) "Pouzivam CP-1250 nebo ISO-8859-2, protoze je to v mem systemu
nastaveno a kazdy kdo to nechape je trouba a nicemu nerozumi."
I kdyz je mne v tomto pripade blizsi postoj skupiny pouzivajici
ISO-8859-2, (stoji za nimi autorita ISO, na rozdil od CP-1250,
za kterym stoji moc a penize Micrsoftu), neni to ani v jednom pripade
prilis konstruktivni a vstricne. Nastesti je nekompatibilita tech dvou
kodovani natolik mala, ze flamewars techto skupin neni zas tak
casta zalezitost.
4) "Pisu bez diakritiky, protoze je to zcela bez problemu pro
kterehokoliv prijemce a odpovida to puvodni konstrukci
sluzby e-mail." Maximalne vstricny a ohleduplny postoj,
nezpusobi zadne problemy nikomu, dokonce ani tem, kdo
si ctou postu a jsou pri tom treba docasne v zahranici, kde
na pocitacich nejsou ani instalovany Latin-2 fonty. Lze
ovsem opravnene namitat, ze to je ustupovani strojum a
ignorovani pokroku.
5) "Pouzivam UTF-8, protoze to je perspektivni a modrni
postup a nadejne reseni zmatku v kodovani" Tento postoj
pokladam za opravneny a doufam, ze Unicode brzy prevladne
a vyresi zmatky, ktere v soucasnosti v kodovani panuji.
Riziko tohoto postoje ale spociva v dosud nedostatecnem rozsireni
UTF-8 a tim v moznosti problemu pro mnoho prijemcu. Zastanci
tohoto postoje jsou take casto tercem utoku ze strany zastancu
pristupu 3).
Preji vsem TeXistum pekne svatky a do noveho roku hodne uspechu,
a take porozumeni pro postoje a problemy druhych.
Lubos Kloc
More information about the csTeX
mailing list