filtrovani slov...

Zdenek Wagner wagner at cesnet.cz
Thu May 5 10:48:31 CEST 2005


On Thu, 5 May 2005, Jaroslav Hajtmar wrote:

> Dobry den.
> Obratil se na mne jeden clovek, ktery potrebuje zpracovat velmi
> rozsahlou databazi cizich slov (pry nekolik set tisic??) (nejake
> foneticke prepisy ze sanskrtu a jinych starych jazyku )... Slova
> obsahuji i apostrofy a dalsi neobvykle znacky... a jsou umistena v
> samostatnych radcich pod sebou.. Ten clovek potrebuje vypsat vsechna
> dvoupismenna, tripismenna, ctyrpismenna, atd.. slova, ale tak, ze
> pismeno ch se ma pocitat jako jedno pismenko a apostrofy a dalsi znacky
> se nesmi do delky slova zapocitat.. Napadlo mne, ze by si s tim mozna

V TeXu bych to rozhodne nezkousel. Ne, ze by to neslo, ale pro takovy ukol
tam nejsou pohodlne nastroje. Uz samotny problem sanskrtu je dost velky.
Jde o to, jak si poradit se sprezkami, napr. kra je sprezka znaku ka + ra,
ale je to jedno pismeno, zatimco kre je sprezka souhlasek ka + ra s
pripojenym znakem e-matra (nesamostatna samohlaska e). V prezentaci z me
prednasky pro CSTUG najdete sprezku "nkhya -- je to 1 pismeno jako sprezka
3 souhlasek, ale v UNICODE je to 5 znaku. Analyza vyzaduje dost
sofistikovany software. Nektere nastroje najdete na
http://bombay.oriental.cam.ac.uk/, dale doporucuji stranky
http://devnag.sarovar.org/ a
http://homepage.ntlworld.com/stone-catend/translit.htm

BTW: ch v devanagarskem pismu neodpovida ceskemu ch, ale je to aspirovane
\v{c}. V sanskrtu je 10 aspirovanych souhlasek, 5 neznelych a 5 znelych.
Hindstina ma cipkove ch, ktere se ale prepisuje jako podtrzene kh (v
devanagarskem pismu se pise jako kha s nuktou).

> poradil TeX.. Prosim, napiste mi, zda je to vubec technicky mozne, nebo
> spis vhodne resitelne... On chtel, abych mu to udelal v Excelu nejakym
> makrem .. ale do toho se mi moc nechce... V teto souvislosti mam tedy
> spis obecny problem, jak se da zjistit pocet znaku slova, ktere nactu
> jako vstupni parametr nejakeho makra. Pokud je slovo dlouhe napr 5 znaku
> vypisu ho, kdyz ne, tak ho spolknu.. Diky za jakoukoliv pripominku ...
> BTW: TeX a sanskrt nebo podobne jazyky .. mate s tim nekdo nejakou
> zkusenost??
>
> Jarda Hajtmar
>
>
>
> ---
> avast! Antivirus: Odchozi zprava cista.
> Virova databaze (VPS): 0518-3, 04.05.2005
> Testovano: 5.5.2005 9:04:26
> avast! (c) copyright 2000-2004 ALWIL Software.
> http://www.avast.com
>
>
>

Zdenek Wagner
e-mail: wagner at cesnet.cz

see also http://hroch486.icpf.cas.cz/wagner/
         http://icebearsoft.euweb.cz




More information about the csTeX mailing list