enctex a unicode

Arnost Stedry arnost at cs.cas.cz
Mon Jun 13 09:05:25 CEST 2005


no ja pochopitelne nemam unicodovy font

ten prikaz

ttf2tfm gentium.ttf -w gentium at Unicode@

rozkouskuje unicodovy font na kousky po 256 znacich (takze v krajnim pripade mam 256 fontu)

v .map souboru to pak vypada zhruba takto:

gentiumT1 <gentium.ttf <T1-WGL4.enc
gentium00 <gentium.ttf <gentium00.enc
gentium01 <gentium.ttf <gentium01.enc
gentium02 <gentium.ttf <gentium02.enc

pro konkretni kodovani navic muzu udelat dalsi specialni (viz prvni radek), cimz muzu celkem bezbolestne pouzivat babel na prepinani jazyku

v konecnem vysledku ten font pdftex includne pouze jednou, takze soubor naroste pouze o pouzita kodovani.

praci s prehazovanim fontu pro ruzne znaky ted za mne dela utf8x a to bych rad delegoval na enctex

na omegu bych klidne presel, jenze ta zatim (co jsem videl) neumi dobre pracovat s TrueTypy.
navic mne prijde, ze ji v soucasnosti prilis nepotrebuju

myslenka preprocesoru se mne taky prilis nelibi (zatim), protoze mi prijde, ze je to zatim udrzitelne v ramci cisteho pdftexu


Arnost Stedry

>Predevsim, encTeX umoznuje, abyste na vstupu mel UTF-8, ale TeX pracoval s
>tim, cemu rozumi, tj. s osmibitovymi znaky. Nemuzete tedy mit unicodovy
>font. Jak velky prostor pro svoji tabulku ma encTeX, to ale nevim. Pokud
>by nestacila, mate asi 2 moznosti:
>
>1. prejit na Omegu
>
>2. pouzit preprocesor, ktery vstup prevede na neco, co jiz TeX zvladne.
>Podobne se to dela v balicku devnag. Jednak proto, ze TeX neumi v TFM
>souborech OpenType (vyslednych moznosti je vice nez 256, takze to nelze
>emulovat ligaturami a virtualnim fontem). Napr. ve slove billi (= kocka,
>posledni i je dlouhe) musi byt na vystupu prvni i drive nez b a ll tvori
>ligaturu. Navic sanskrtska ligatura lla vypada jinak nez hindska a
>ligatura kta se v moderni hindstine vetsinou pise jinak nez ve starsi
>hindstine, takze jen fontem bez preprocesoru by se to stejne resilo dost
>tezko. Podobne si muzete zpracovat svuj vicejazycny dokument tak, aby
>obsahoval osmibitove znaky ve vhodnem lidsky necitelnem kodovani. Dobre je
>zachovat rozlozeni na radky, aby pripadna chyba v predzpracovanem
>dokumentu byla hlasena na stejnem radku jako v puvodnim textu.
>
>
>
>>existuje nejake vhodne reseni? hledal jsem nejakou dobu na netu, ale na
>>nic jsem nerazil.
>>
>>Arnost Stedry
>>
>>
>>
>>
>
>Zdenek Wagner
>e-mail: wagner at cesnet.cz
>
>see also http://hroch486.icpf.cas.cz/wagner/
>         http://icebearsoft.euweb.cz
>
>
>




More information about the csTeX mailing list