[cstex] Latex2html a utf-8

Zdenek Wagner zdenek.wagner at gmail.com
Mon Feb 4 20:45:48 CET 2008


4.2.08, Josef Feit <jfeit at ics.muni.cz>:
> Hana Skoumalova napsal(a):
> > Můj editor ukládá v takovém kódování, v jakém mu řeknu (pokud to jde).
> > Ty zdrojáky *jsou* v UTF-8 a latex je spokojeně kompiluje. Trable mám
> > jenom s latex2html.
>
> Podobne problemy jsem mel se zpracovavanim XML UTF-8 dokumentu v
> Perlu. Nekdy pomahaly moduly jako Encode ale ne vzdy. Nepodarilo se mi
> prijit na to, kde je problem (pouzivam nekolik modulu a s temi je to
> slozite, kratky demo program v Perlu pracoval dobre.
>
Problem bych videl v tom, ze perlovske retezce nejsou retezce znaku,
ale retezce bajtu. Anglicky znak ma tedy 1 bajt, cesky a slovensky s
diakritikou 2 bajty, devanagarsky 3 bajty.  Kdysi jsem potreboval v
hindskem textu najit znak "nukta". Protoze vsak tento znak ma nastaven
priznak "combinig diacritical mark", nejde to v XML editoru napsat do
vyhledavaciho dialogu, takze jsem si na to psal programek v perlu.

> Jinymi slovy: dvoji UTF-8 zakodovani vystupu nemusi byt problem
> specificky pro latex2html.
>
> Ja bych pouzil ten spravny vystup a opravil hlavicku, ovsem takovi
> jako ja Ameriku neobjevili. Pokud prijdete na reseni, dejte vedet.
>
> Pozdravy
> JF
> _______________________________________________
> csTeX mailing list
> csTeX at cs.felk.cvut.cz
> http://lists.felk.cvut.cz/mailman/listinfo/cstex
>


-- 
Zdeněk Wagner
http://hroch486.icpf.cas.cz/wagner/
http://icebearsoft.euweb.cz


More information about the csTeX mailing list