[cstex] XeTeX a utf-8 (bylo: vstupni kodovani csplainu, prosim o nazor)

Mon Oct 8 09:51:45 CEST 2012

Dne 7.10.2012 03:12, Jiří Rybička napsal(a):
> Dobrý den,
> to máte určitě pravdu, ale měl jsem tady na mysli něco jiného: když zvolíte
> pomocí \fontspec nějaký jiný font než Latin Modern a v textu pak použijete
> příkaz například pro paragraf \S, vysází se znak, který do toho fontu nepatří.
> Přirozenější je použít přímo znak pro paragraf, který jak ve zdrojovém
> textu, tak i ve vysázené podobě vypadá stejně -- tj. podle použitého fontu.
>
> Předávání dokumentů v podobě zdrojového textu je samozřejmě široký problém,
> v němž kódování hraje důležitou roli. Ale jak už tu někdo poznamenal, UTF-8
> je pravděpodobně jedinou cestou, jak se postupně zbavit nejrůznějších zmatků
> s kódováním, a věřím, že tato cesta je reálná.
>
> JR.

Dobrý den,

myslím, že nejsme ve sporu, chtěl jsem zdůraznit výhodu TeX sekvencí v 
situaci, kdy (zatím) panuje značná nejednotnost v kódování. Ostatně jsem 
to byl já, kdo zde v diskusi propagoval utf-8 všude, kde to je jen 
trochu možné. Nicméně dávám přednost tomu, aby byl v místě kde chci mít 
paragraf vysázen paragraf (byť třeba v nepatřičném fontu), než aby tam 
byl úplně jiný znak ve správném fontu.

Abych odpověděl i panu Wagnerovi: představme si celkem běžnou situaci, 
kdy napíšu článek, pošlu ho spoluautorovi v Japonsku ke kontrole či 
doplnění a on ho pak pošle vydavateli, což je americká firma sídlící v 
Indii. Konečným příjemcem, u něhož potřebuji aby plně rozumněl co jsem 
chtěl napsat, je člověk který ve vydavatelství zpracovává konečnou sazbu 
časopisu či sborníku. Můj zdrojový soubor předtím projde řadou počítačů 
nejen u spoluautora, ale i v redakci. Zatím jedinou možností, jak 
dosáhnout "přežití" zdrojového textu bez nějakých překódování je držet 
se striktně v mezích základního 7-bit ASCII. No a TeX sekvence mně 
umožňují v tomto "odolném" kódu napsat i české znaky, přičemž člověk 
zpracovávající konečnou sazbu ví co jsem chtěl napsat a taky si ví rady, 
jak příslušný znak vysázet v tom správném (a mně dopředu neznámém) fontu.

Až si budu moci být jist, že můj zdrojový soubor v utf-8 dorazí na místo 
v utf-8, budu samozřejmě i v těchto případech používat s radostí utf-8. 
Jenže dosavadní zkušenost je jiná. Když v analogickém případě vydavatel 
vyžaduje pouze zdroj ve Wordu, pak místo českých znaků bude v sazbě s 
pravděpodobností hraničící s jistotou něco úplně jiného. A to prý Word 
používá Unicode (utf-16?)!

S pozdravem,

Luboš Kloc