[cstex] Kódování TeXovského zdrojového dokumentu was: Re: csplain a WinEdt 7.0

Zdenek Wagner zdenek.wagner at gmail.com
Wed Oct 3 15:43:02 CEST 2012


Dne 3. října 2012 15:33 Milan Vancura <milan at ucw.cz> napsal(a):
> Dobrý den.
>
>> Mimochodem, ono je těžké říci, co je vlastně správně.
>
> Dovolím si nesouhlasit: je to naopak velmi jednoduché: správně je předpokládat,
> že musím znát kódování souborů, se kterými pracuji. Neexistuje "vlastní
> kódování operačního systému vhodné pro TeXové zdrojové soubory".
>
> Důvodů je mnoho, ve zkratce napíši jen ty, se kterými jsem se osobně potkal v
> minulosti a nepříjemně mě "kously":
>
>  * soubory putují mezi mnoha počítači různých OS, např. e-mailem,
>  * i tentýž člověk (autor) může na soubor pohlížet po Síti odjinud,
>  * na témže počítači se může změnit to "vlastní kódování",
>  * mohu dát zdrojáky ke stažení na web a návštěvníci budou zmatení
>  * z opačného pohledu: najdu na webu dokument 5 let starý s dnes již neplatným
>    e-mailovým kontaktem na autora
>
> Proto je chybný předpoklad, že kódování se má nastavovat pro TeX. Kódování má
> být nastavené V DOKUMENTU. Viz XML (jak ho nemám rád, tohle má vyřešeno lépe),
> to dokonce umožňuje mít různé části souboru v různých kódováních. Což bez UTF-8
> je občas nutnost (asi nemusím říkat zrovna Vám :-) )
>
XML to má jako součást standardu, v současném TeXu se to dá řešit pomocí:
%! -translate-file=XXX.tcx
místo XXX se doplní správné kódování

> Takže já bych Vaši větu s dovolením řekl jinak:
>
> Je jednoduché říci, co je správně. Je těžké to v TeXové komunitě změnit.
> Setrvačnost je obrovská, bohužel. Třeba kdyby se to do nějakého dalšího TL
> naimplementovalo, že by to začlo víc lidí používat - ale bude to těžké.
>
> Milan Vančura
>
> P.S.: Ten problém se netýká jen kódování. Kdo jste se kdy dostal k nějakému
> staršímu zdrojáku v TeXu (nejlépe cizímu, třeba právě přes web), určitě jste
> také řešili otázek více: v jakém je to kódování? jakým formátem TeXu? jakou
> verzí toho formátu? Atp. Pro některé dokumenty jsem to nebyl schopný 100%
> vyřešit a bylo jednodušší určité části přepsat ručně znovu. To se pak ztrácí
> výhoda TeXu, že dává stejňé výsledky i po desítkách let - a že on sám dává.

Když někdo napíše TeXový zdroják v CP125 a na začátek souboru napíše
%! -translate-file=cp1250.tcx

zpracuje se to správně i u mě na Linuxu. Pokud ale ten zdroják dá na
web a server má nastavano, že je to MIME typ text/plain, pak se mi to
ve webovém prohlížeči zobrazí jako text a pokud mi navíc server řekne,
že je kódování cp1250, uvidím správně i češtinu. Když si to však
uložím na disk, webový prohlížeč ví, že mám locales UTF-8 a provede
konverzi (totéž při přenosu přes clipboard). V hlavičce tedy bude
napsáno cp1250 (a TeX to použije), ale soubor bude v UTF-8 :-(

> _______________________________________________
> csTeX mailing list
> csTeX at cs.felk.cvut.cz
> http://lists.felk.cvut.cz/mailman/listinfo/cstex



-- 
Zdeněk Wagner
http://hroch486.icpf.cas.cz/wagner/
http://icebearsoft.euweb.cz




More information about the csTeX mailing list