RH 8/9 a enctex

Zdenek Wagner wagner at cesnet.cz
Mon Apr 14 12:12:04 CEST 2003


On Mon, 14 Apr 2003, David Necas (Yeti) wrote:

> On Mon, Apr 14, 2003 at 11:49:12AM +0200, David Necas (Yeti) wrote:
> >
> > Unicode by se standardne mel tridit podle
> >
> > http://www.unicode.org/reports/tr10/
>
> Asi bych to mel upresnit. Tenhle algoritmus umoznuje proste
> porovnavat retezce. Pravidla jednotlivych jazyku se
> samozrejme lisi. Taky je moznost tridit to podle ceskeho
> UTF-8 trideni v Linuxu (LC_COLLATE v cs_CZ.utf8 locale).
>
Je vsak otazkou, jestli standardni LC_COLLATE umi spravne osetrit ch.
Obavam se, ze neumi. V tom unicodovskem algoritmu je $5, ktery umoznuje
definovani narodnich pravidel. Podle hodne zbezneho nahlednuti se mi zda,
ze by zde slo vlozit ceska a slovenska pravidla a zaridit, ze by se
csindex nezhroutil na cizich znacich a ze by daval stejne vysledku vsude
bez ohledu na to, zda je v systemu spravne LC_COLLATE. Navic by fungoval i
v pripade, ze OS vubec nezna UTF-8 (napr. v OS/2 si v editoru neotevru
soubor v UTF-8, ale XML soubory v UTF-8 samozrejme funguji spravne).

> Yeti
>

Zdenek Wagner
e-mail: wagner at cesnet.cz  or  wagner at icpf.cas.cz

see also http://hroch486.icpf.cas.cz/wagner/
         http://icebearsoft.euweb.cz




More information about the csTeX mailing list