[cstex] XeTeX a utf-8 (bylo: vstupni kodovani csplainu, prosim o nazor)
Luboš Kloc
kloc at ipm.cz
Mon Oct 8 09:51:45 CEST 2012
Dne 7.10.2012 03:12, Jiří Rybička napsal(a):
> Dobrý den,
> to máte určitě pravdu, ale měl jsem tady na mysli něco jiného: když zvolíte
> pomocí \fontspec nějaký jiný font než Latin Modern a v textu pak použijete
> příkaz například pro paragraf \S, vysází se znak, který do toho fontu nepatří.
> Přirozenější je použít přímo znak pro paragraf, který jak ve zdrojovém
> textu, tak i ve vysázené podobě vypadá stejně -- tj. podle použitého fontu.
>
> Předávání dokumentů v podobě zdrojového textu je samozřejmě široký problém,
> v němž kódování hraje důležitou roli. Ale jak už tu někdo poznamenal, UTF-8
> je pravděpodobně jedinou cestou, jak se postupně zbavit nejrůznějších zmatků
> s kódováním, a věřím, že tato cesta je reálná.
>
> JR.
Dobrý den,
myslím, že nejsme ve sporu, chtěl jsem zdůraznit výhodu TeX sekvencí v
situaci, kdy (zatím) panuje značná nejednotnost v kódování. Ostatně jsem
to byl já, kdo zde v diskusi propagoval utf-8 všude, kde to je jen
trochu možné. Nicméně dávám přednost tomu, aby byl v místě kde chci mít
paragraf vysázen paragraf (byť třeba v nepatřičném fontu), než aby tam
byl úplně jiný znak ve správném fontu.
Abych odpověděl i panu Wagnerovi: představme si celkem běžnou situaci,
kdy napíšu článek, pošlu ho spoluautorovi v Japonsku ke kontrole či
doplnění a on ho pak pošle vydavateli, což je americká firma sídlící v
Indii. Konečným příjemcem, u něhož potřebuji aby plně rozumněl co jsem
chtěl napsat, je člověk který ve vydavatelství zpracovává konečnou sazbu
časopisu či sborníku. Můj zdrojový soubor předtím projde řadou počítačů
nejen u spoluautora, ale i v redakci. Zatím jedinou možností, jak
dosáhnout "přežití" zdrojového textu bez nějakých překódování je držet
se striktně v mezích základního 7-bit ASCII. No a TeX sekvence mně
umožňují v tomto "odolném" kódu napsat i české znaky, přičemž člověk
zpracovávající konečnou sazbu ví co jsem chtěl napsat a taky si ví rady,
jak příslušný znak vysázet v tom správném (a mně dopředu neznámém) fontu.
Až si budu moci být jist, že můj zdrojový soubor v utf-8 dorazí na místo
v utf-8, budu samozřejmě i v těchto případech používat s radostí utf-8.
Jenže dosavadní zkušenost je jiná. Když v analogickém případě vydavatel
vyžaduje pouze zdroj ve Wordu, pak místo českých znaků bude v sazbě s
pravděpodobností hraničící s jistotou něco úplně jiného. A to prý Word
používá Unicode (utf-16?)!
S pozdravem,
Luboš Kloc
More information about the csTeX
mailing list