Proc pouzit encTeX

Zdenek Wagner wagner at beba.cesnet.cz
Fri Dec 4 12:59:40 CET 1998


On Thu, 3 Dec 1998, Alexandr Malusek wrote:

> Date: Thu, 3 Dec 1998 22:44:42 +0100
> From: Alexandr Malusek <malusek at hroch.ujf.cas.cz>
> Reply-To: csTeX at cs.felk.cvut.cz
> To: cstex at cs.felk.cvut.cz
> Subject: Re: Proc pouzit encTeX
>
> wagner at beba.cesnet.cz (Zdenek Wagner) writes:
>
> > Vlozeni informace o kodovani ma smysl pouze tehdy, kdyz mam
> > zaruceno, ze dokument _NIKDY_ neprojde kanalem, ktery nejakou
> > konverzi kodu provadi, a ja jako uzivatel chci dokument pouze
> > vytisknout bez jakychkoliv zasahu.
>
> Nicmene se chci vyjadrit ohledne vyse uvedeneho tvrzeni. Neni mi jasne
> proc neni mozne jako jmeno definujici kodovani pouzit takovy retezec
> znaku, kde posloupnost ordinalnich hodnot techto znaku je v kazdem
> kodovani jina. Napriklad pokud bych pouzil
> \encoding{<a_s_casrkou>}
> kde <a_s_carkou> je jeden znak, pak v ISO-8859-2 by tento znak mel
> nejakou hodnotu, rekneme 130. V CP1250 by mel jinou hodnotu, napr.
> 140. Pouhym testem v TeXu na ordinalni hodnotu bych pak jednoznacne
> urcil typ kodovani dokumentu. Podle toho bych pak vybral prevodni
> tabulku pro prevod do nativniho kodovani.
>
To jde v pripade, kdy vite, ze dokument je psan cesky a nejsou v
nem cizi slova s jinymi akcenty. Napr. \c{c} v jednom kodovani
vypada jako \v{c} v jinem. Pri praci s ceskymi dokumenty tohle
delam rucne -- v editoru se podivam, jak se mi cestina mrsi, a
podle toho zaradim spravnou konverzi.

> Fungovalo by to, pokud by se dokument prenasel jako binarni i jako
> textovy - proste by doslo k automatickemu prekodovani nejen textu
> dokumentu, ale i nazvu kodovani.
>
To ovsem znamena, aby se TeX a LaTeX registroval u IANA a
prislusne algoritmy se daly do RFC a zavedly do vsech
internetovych protokolu -- misto toho, aby se pouzilo jiz to, co
je davno specifikovano.

> Hm, ted me napada, ze by to nefungovalo u dokumentu obsahujicich vice
> kodovani najednou. S takovymi soubory by se vzdy muselo zachazet jako
> s binarnimi. Take uzivatele, co mohou na klavesnici psat jen znaky s
> ordinalnimi cisly 0-127 by meli problemy. Takze zpatky na stromy
> ... ;-)
>
Prave tohle ma vyreseno UNICODE i SGML. Proc se to ma vymyslet
znovu?

Ostatne, napadl me jeste jeden duvod pro encTeX. Jak psal Petr
Olsak, inputenc predpoklada identicke zobrazeni v xord a xchr. To
uzivatele emTeXu casto nemaji, protoze si jiz davno zvykli na TCP.
Pokud tedy od nekoho dostanou dokument pouzivajici inputenc,
nebudou jej schopni vytisknout bez toho, ze by si vygenerovali
novy format bez TCP. Pokud by na vsech platformach byl encTeX,
meli by uzivatele emTeXu stejny komfort jako drive s TCP a ostatni
by mohli definovat vstupni i vystupni kodovani sveho dokumentu
nezavisle na tom, zda maji plain, LaTeX, AMS-TeX nebo cokoliv
jineho.

> --
> A. Malusek  (malusek at ujf.cas.cz)
> UJF AV CR
>

Zdenek Wagner

E. Hala Laboratory of Thermodynamics,
Institute of Chemical Process Fundamentals
of the Academy of Sciences of the Czech Republic
e-mail: wagner at mbox.cesnet.cz  or  wagner at icpf.cas.cz

Local editor of the Bulletin of the Czech and Slovak TeX Users Group,
member of the CSTUG board
e-mail: Zdenek.Wagner at cstug.cz  or  bulletin at cstug.cz  or  zpravodaj at cstug.cz

Member of Czech OS/2 Users Group (http://cs.felk.cvut.cz/~kunaa/)

see also http://www.icpf.cas.cz/wagner/
         http://www.cstug.cz/
         http://members.xoom.com/z_wagner/




More information about the csTeX mailing list