OT: Re: archiv a diakritika

Lubos Kloc kloc at ipm.cz
Fri Jun 7 15:47:00 CEST 2002


Zdenek Wagner wrote:
> 
> On Fri, 7 Jun 2002, Pavel Janík wrote:
> 
> >    From: olsak at math.feld.cvut.cz (Petr Olsak)
> >    Date: Fri, 7 Jun 2002 07:29:42 +0000 (UTC)
> >
> > Ahoj PetÅ e,
> >
> >    > Ja bych si dovolil nesouhlasit. Mohu vas seznamit s mym internim
> >    > rozhodnutim k problemu diakritiky:
> >
> a prave tenhle mail prisel nejspis v UTF-8, kteremu pine na beba.cesnet.cz
> nerozumi a pres ssh do OS/2 dorazi naprosto nesrozumitelne smeti. Asi bych
> to mohl zasejvovat a prohnat pres iconv, ale to se mi vubec nechce...
> 
> > toto rozhodnutí je Tvoje rozhodnutí. Podle mého názoru je to špatné
> > rozhodnutí. Nebudeš moci komunikovat s úŠady, se zahraniĠím (umí Tvé
> > terminály psát euro - ⠬?) apod. Pokud bychom Tvé rozhodnutí vzali
> > ad absurdum, tak budeš komunikovat pomocí 7bit ascii celý život, protože
> > zcela jistĠ do Tvé smrti bude existovat alespoŠ jeden stroj, který neumí
> > použít osmý bit. Mysleme modernĠ!
> >
..... a t.d.

Mysleme moderne!

   Prave mail pana Janika muze slouzit jako ukazka
rady problemu spojenych s ceskou diakritikou v e-mailu.

Obecne lze souhlasit s panem Ceplem, ze stroje by se
mely prizpusobit lidem, ne naopak. Jenze tady neni problem
ve strojich, ale v neschopnosti lidi dohodnout se na spolecnych
postupech.

Sitova sluzba e-mail je velice stara a puvodne byla navrzena jako
sedmibitova, pritomnost znaku nad 127 ve zprave byla nepripustna.
Dnes uz vetsina serveru prenasi bez problemu i osmibitove
zpravy, ale neda se na to spolehat. Takze zpravy s ceskou diakritikou
 mohou siti putovat bud jako osmibitove, nebo zakodovane do sedmibitove
podoby. Pro prosty text se pouziva dnes temer vyhradne MIME
quoted-printable kodovani. 
Dalsim problemem je existence mnoha ruznych kodovani ceskych znaku,
vetsinou v zavislosti na pouzite platforme. To samo o sobe by 
se jeste dalo nejak prezit, ale neexistuje take zadny spolecny
pristup k tomu, co ma delat server a co ma delat klient. 
Nektere servery proto automaticky meni kodovani zprav, zejmena
osmibitovych, a mohou tak zpusobit neplatnost informace o kodovani
v hlavicce zpravy. Tohle casto nemuze ovlivnit ani odesilatel, ani
adresat a u konferenci je to samozrejme jeste o neco slozitejsi.
V tomto zmatku nelze nijak zarucit, ze prijemce dostane citelnou
zpravu se spravnou diaritikou, i kdyz to v rade pripadu muze fungovat.
Sedmibitovy text bez diakritiky je naproti tomu jednoznacny co do
kodovani a bezproblemovy co do prenosu, nikdo se nepokousi ho 
transformovat "k obrazu svemu" a jeho zmrseni proto nehrozi.

Zpet k mailu pana Janika; ten ma v hlavicce nasledujici radek:
X-MIME-Autoconverted: from quoted-printable to 8bit by
relay.felk.cvut.cz id g579GIAK071514
a opravdu ke mne dorazil jako osmibitovy v kodovani UTF-8.
V archivu je ale ulozen jako sedmibitovy quoted-printable
a v alternativnim archivu zatim neni vubec.
Pokud by mezi mnou a serverem relay.felk.cvut.cz byl na
ceste server nepodporujici prenos osmibitovych zprav, 
dostal bych mail pana Janika nejspis nevratne zmrseny,
a to i pres to, ze jej pan Janik patrne odeslal jako sedmibitovy.

Podle meho nazoru tedy je spravne usilovat o bezproblemovy
prenos ceskeho textu vcetne diakritiky, ale soucasny stav
pravidel a jejich dodrzovani to neumoznuje. Proto
diakritiku nepouzivam.

Nejak jsem se moc rozjel, omlouvam se.....


                         Lubos Kloc








More information about the csTeX mailing list