[cstex] Kódování TeXovského zdrojového dokumentu was: Re: csplain a WinEdt 7.0

Milan Vancura milan at ucw.cz
Wed Oct 3 16:18:35 CEST 2012


> XML to má jako součást standardu, v současném TeXu se to dá řešit pomocí:
> %! -translate-file=XXX.tcx
> místo XXX se doplní správné kódování

Ano, to odpovídáte na obojí: problém i současný stav. Ten problém je, že to v
TeXu není standard...

> zpracuje se to správně i u mě na Linuxu. Pokud ale ten zdroják dá na
> web a server má nastavano, že je to MIME typ text/plain, pak se mi to
> ve webovém prohlížeči zobrazí jako text a pokud mi navíc server řekne,
> že je kódování cp1250, uvidím správně i češtinu. Když si to však
> uložím na disk, webový prohlížeč ví, že mám locales UTF-8 a provede
> konverzi (totéž při přenosu přes clipboard). V hlavičce tedy bude
> napsáno cp1250 (a TeX to použije), ale soubor bude v UTF-8 :-(

Opět ano - to je známý problém. Ale je to problém někoho jiného: vždycky může
být někdo, kdo nesprávně nebo nedostatečně označí MIME typ souboru (kdekoliv,
třeba na webu nebo jako přílohu e-mailu) nebo kdo necitlivě překóduje soubor.
Ale to není argument proti, ale naopak PRO začít ta metadata uvádět ve
standardní hlavičce. Když to bude standardní, mohou se na to ty utility
spolehnout a používat to. V současnosti pro typ text/plain existují na určení
jeho kódování pouze šílené heuristiky s mizernou spolehlivostí. Navíc do té
hlavičky by šlo uložit i použitý formát TeXu atp.

Např. na systémech unixového typu není problém pak takovou hlavičku přidat do
databáze programu find (čili pro Solaris, Linux, Mac OS X...), odkud to pak
bere i mnoho dalších programů - a to je jen začátek, jen první nástřel, co mě
napadl. A pak by nebyl problém, aby např. mailový klient při vkládání TeXového
zdrojáku automaticky k němu uložil MIME typ "text/x-tex; charset=iso8859-2".

Milan Vančura



More information about the csTeX mailing list