[cstex] vstupni kodovani csplainu, prosim o nazor

Thu Oct 4 12:16:26 CEST 2012

Dne 4. října 2012 11:14 Michal Růžička <xruzick7 at fi.muni.cz> napsal(a):
> Dobrý den,
> ...
>
>> Ovšem csplain používají
>> konzervativní lidé, kteří si spíše ohnou svůj systém na použití stejného
>> kódování, jaké používali desítky let, než aby museli konvertovat veškerou
>> archivovanou práci do nového kódování.
>
> Tohle osobně považuji za cestu do pekel. Násilně ohýbat celý systém do
> starého kódování považuji za zbytečnost a dobrý způsob, jak si způsobit
> neočekávané problémy s těžko zjistitelnou příčinnou. Vývoj holt jde
> dopředu. A v IT to platí dvojnásob.
>
> Staré dokumenty hromadně převádět netřeba, protože s největší
> pravděpodobností už je nikdo nikdy znovu zpracovávat nebude. A pokud
> ano, tak asi není velký problém je v tomto případě až dle potřeby
> převést do jiného kódování, respektive zpracující aplikaci sdělit, že
> vstup je v daném kódování a ta by si s tím měla umět poradit. (Velmi
> dobré by bylo, pokud by někde v dokumentu byla poznámka, v jakém že je
> kódování - stačí i parametr u inputenc v případě LaTeXu, komentář
> %&encoding=UTF-8 Unicode pro XeTeX, modeline pro Vim někde na konci
> souboru apod.)
>
Hromadná konverze opravdu není nutná. Mám locales en_US.UTF-8, ve
fmtutil-local.cnf mám nastaveno, že (pdf)csplain i (pdf)cslatex
očekávají vstupní kódování v UTF-8 a mám aktivovaný encTeX. Když jsem
potřeboval zpracovat řadu souborů csplainem a vstupní kódování bylo
ISO-8859-2, stačilo na začátek souboru vnutit jeden \input, který
načetl jiné překódovací tabulky pro encTeX. Pokud tedy mám editor,
který umí editovat v jiném kódování než jaké mám v systému, pak si s
takovým souborem poradím snadno. Pokud takový editor nemám a soubor
chci použít bez editace, pak takový \input bych nemusel editorem
přidat bez poškození. Mohu si však připravit soubor obsahující pouze
příslušný \input a pak soubory spojit (v unixu pomocí cat, v dosu
pomocí copy). Když mi články do Zpravodaje připravoval Pavel Stříž,
měl je v CP1250, protože to tvořil ve Windows. Já jsem dodal části
kódované v UTF-8. A protože jsem ty články dodané Pavlem nemusel dále
editovat, nedělal jsem konverzi, ale využil jsem možnosti, které TeX
nabízí, a spojil jsem dohromady části v různém kódování. Přechod na
UTF-8 jako default be nebyl katastrofa, i když jsou LaTeXové balíčky,
které pak hlásí podivné chyby (např. url.sty). I to se však dá v
encTeXu řešit, ale člověk to musí vědět a přidat do zdrojáku několik
příkazů (vypnout a pak zase zapnout \mubytein).

Protože nejsem aktivním uživatelem csplainu, jen ho použít umím a
občas zpracovávám cizí plainové soubory, nechci mít v rozhodování
hlavní slovo.

> Tak to tedy vidím já. :-)
>
> S pozdravem,
> Michal Růžička
>
>> Já například typicky pracuji v
>> xtermu. Už přes deset let dokážu mít na ploše vedle sebe různé xtermy,
>> jedny kódované podle ISO-8859-2 a druhé v UTF8. Je naprosto jedno, jaký
>> typ xtermu otevřu, mám je v nabídce vedle sebe. Ovšem nějak jsem se za ta
>> léta nepřinutil používat xtermy s UTF8. Možná, že nejsem sám.
>
>
>
> --
> Michal Růžička <xruzick7 at fi.muni.cz>
> OpenPGP key: https://www.fi.muni.cz/~xruzick7/pgp-klic/
> Fingerprint: 1CB2 41B9 F029 4B47 EECD  9BDA 90C9 CEB0 524C DACB
> _______________________________________________
> csTeX mailing list
> csTeX at cs.felk.cvut.cz
> http://lists.felk.cvut.cz/mailman/listinfo/cstex

-- 
Zdeněk Wagner
http://hroch486.icpf.cas.cz/wagner/
http://icebearsoft.euweb.cz