enctex a unicode

Zdenek Wagner wagner at cesnet.cz
Mon Jun 13 08:33:50 CEST 2005


On Sun, 12 Jun 2005, Arnost Stedry wrote:

> Dobry den,
>
> rozhodl jsem se jeste trochu experimentovat s enctexem a utf8 a mam
> nekolik dotazu.
>
> pomoci
> ttf2tfm gentium.ttf -w gentium at Unicode@
>
> techto fontu je asi 7 a jejich jmena jsou nekde mezi getium00--gentiumff
> pri pouziti utf8x.sty jsou znaky zaktivneny a expandovany na neco typu
> \font\gentiumXY prekodovany_znak
>
> v enctexu bych musel pouzit konstrukci:
> \mubyte \sekvence ^^c3^^9f\endmubyte
>
> ovsem tady vidim problem. vpodstate bych musel kazdemu specialnimu znaku
> (kterych muze byt zhruba 6*256) nadefinovat nove makro,
> nevim, je-li v moci texu vubec takove mnozstvi maker pojmout.
>
Predevsim, encTeX umoznuje, abyste na vstupu mel UTF-8, ale TeX pracoval s
tim, cemu rozumi, tj. s osmibitovymi znaky. Nemuzete tedy mit unicodovy
font. Jak velky prostor pro svoji tabulku ma encTeX, to ale nevim. Pokud
by nestacila, mate asi 2 moznosti:

1. prejit na Omegu

2. pouzit preprocesor, ktery vstup prevede na neco, co jiz TeX zvladne.
Podobne se to dela v balicku devnag. Jednak proto, ze TeX neumi v TFM
souborech OpenType (vyslednych moznosti je vice nez 256, takze to nelze
emulovat ligaturami a virtualnim fontem). Napr. ve slove billi (= kocka,
posledni i je dlouhe) musi byt na vystupu prvni i drive nez b a ll tvori
ligaturu. Navic sanskrtska ligatura lla vypada jinak nez hindska a
ligatura kta se v moderni hindstine vetsinou pise jinak nez ve starsi
hindstine, takze jen fontem bez preprocesoru by se to stejne resilo dost
tezko. Podobne si muzete zpracovat svuj vicejazycny dokument tak, aby
obsahoval osmibitove znaky ve vhodnem lidsky necitelnem kodovani. Dobre je
zachovat rozlozeni na radky, aby pripadna chyba v predzpracovanem
dokumentu byla hlasena na stejnem radku jako v puvodnim textu.

> existuje nejake vhodne reseni? hledal jsem nejakou dobu na netu, ale na
> nic jsem nerazil.
>
> Arnost Stedry
>
>

Zdenek Wagner
e-mail: wagner at cesnet.cz

see also http://hroch486.icpf.cas.cz/wagner/
         http://icebearsoft.euweb.cz




More information about the csTeX mailing list