Devanagari a Unicode

Zdenek Wagner wagner at cesnet.cz
Thu Mar 16 14:13:03 CET 2006


On Thu, 16 Mar 2006, Arnost Stedry wrote:

> Dobry den,
>
> vznikla mi potreba sazet indickou bilingvu a nechtel bych na to pouzivat
> Velthuisov balik (uzivani preprocesoru mi prijde pomerne zastarale) , ale
> pouzit unicode.
>
> V Babelu se mluvi v tomto kontextu o kodovani LDV, ale nemuzu nikde najit jeho
> definici.
>
> Ma nekdo zkusenost s podobnou sazbou a muze mi pripadne neco doporucit, ci
> dokonce: nezna snad nekdo definici LDV ?
>
Zkusil jsem a LDV mi nevrati nic rozumneho, co by souviselo s indickymi
jazyky. Bohuzel neznam zadny system, ktery by v TeXu dokazal brat primo
devanagarske texty psane v UTF-8. Existuje zarodek podpory pro Omegu, ale
ten je udelan ta, ze vezme text ve Velthuisove transliteraci a
preprocessing se provadi primo pomoci OTP. Prvni krok je konverze pomoci
OTP z Velthuisovy transliterace do Unicode, takze mozna by to slo nejak
upravit pro vstup textu v UTF-8. Na to ale potrebujete podporu v textovem
editoru, v nemz budete text prepisovat. Chce to devanagarskou klavesnici a
devanagarsky font OpenType a plnou podporu OpenType v systemu. Je totiz
nutno umet kombinovat skupiny souhlasek do sprezek a prehodit kratke
nesamostatne i (i-matra) pred souhlasku. To prave resi ve Velthuisove
balicku preprocesor. Take zalezi na tom, zda pisete v sanskrtu, starsi
hindstine, nebo soucasne moderni hindstine. Starsi hindstina nepouziva
vsechny sanskrtske sprezky a moderni hindstina jich pouziva jeste mene,
zejmena se prestavaji pouzivat vertikalni sprezky .t.ta, .t.tha, .d.da
apod. V UTF-8 je nutno vkladat znaky ZW-J, preprocesor to resi pomoci
prepinacu @sanskrit, @hindi a @modernhindi a pak pripadne jednotlive
pomoci @ligs a @noligs.

Obecne o transliteracich se doctete na
http://homepage.ntlworld.com/stone-catend/translit.htm

Muj drobny test pouziti UTF-8 je na
http://hroch486.icpf.cas.cz/devnag-utf8/ (puvodni rucne psany zdrojak je
test.xml, devnag.dtd definuze znakove entity, normalize.xsl z nich udela
znaky v UTF-8; test.html i test.dn jsou generovany z test.xml a dodatecne
mirne rucne doeditovany).

Pokud se rozhodnete pro Velthuisuv balicek, doporucil bych verzi z CVS na
http://devnag.sarovar.org, protoze verze 2.12 na CTAN ma v dokumentaci
popsane dosud neimplementovane vlastnosti, verze 2.13 na TL 2005 je temer
OK, ale od uzaverky TL jsem nasel nekolik drobnych chyb, ktere jsou jiz na
CVS opraveny. Navic pocinaje verzi z TL 2005 je zmenena adresarova
struktura, aby odpovidala TDS (tj. TeXLive + teTeX + MikTeX) a na CVS je
nedavno aktualizovany README s instalacnim navodem.

{\dn
"subhakaamanaao.m ke saath
aapakaa }

Zdenek Wagner
e-mail: wagner at cesnet.cz

see also http://hroch486.icpf.cas.cz/wagner/
         http://icebearsoft.euweb.cz
-------------- next part --------------
A non-text attachment was scrubbed...
Name: s-pozdravem-zw.gif
Type: image/gif
Size: 2329 bytes
Desc: 
URL: <http://lists.felk.cvut.cz/pipermail/cstex/attachments/20060316/790539eb/attachment-0002.gif>


More information about the csTeX mailing list