Jak nejlepe osetrit nezadouci znaky pri automatickem vkladani textu?

Zdenek Wagner wagner at cesnet.cz
Wed Feb 16 10:59:09 CET 2005


On Wed, 16 Feb 2005 hucik at inext.cz wrote:

> Dobry den,
>
> chtel bych se zeptat zda-li nekdo nahodou nevite o nejakem scriptu, ktery
> by komplexne resil prefixovani ruznych ridicich znaku, ktere se mohou
> objevit pri automatickem vkladani externich textovych dat napr. z databaze
> do latexoveho zdrojaku a mohly by nepriznivym zpusobem ovlivnit jeho
> kompilaci, nebo sazbu.
>
> V tuto chvili to resim jednoduchou sadou nahrazovacich regexp, ale bohuzel
> neznam vsechny ridici znaky a tak bych si rad usetril praci a badani
> metodou pokus/omyl.
>
Znaku, ktere musite osetrit, je pomerne malo. Jsou to:
\ # $ % ^ & { } _
Znak ~ je obvykle aktivni a pouziva se pro nezlomitelnou mezeru. Pokud
chcete tildu, musite jej osetrit take. Na pozicich znaku < a > je
spanelska interpunkce, otaznik a vykricnik. A pak uz jen zbyva otazka, jak
si chcete poradit se spojovniky a pomlckami (laik muze do databaze psat
spojovniky misto pomlcek, pripadne muze pouzit pomlcku, ktera ma v mnoha
kodovanich specialni kod), stejne tak v ruznych kodovanich je specialni
znak pro elipsis (...). V nekterych kodovanich je i dalsi znak pro
apostrof. Take musite nejak nalozit s uvozovkami.

Pokud databaze pouziva UNICODE, muzete tam v zasade mit uplne cokoliv.
Zarodek konverzni mapy mam, ovsem ja to delam kvuli konverzi z OpenOffice
do LaTeXu. Pouzivam XSLT2 (Saxon8) a preklad je implementovan v
<xsl:character-map>. V nejblizsi dobe tam dodelam rectinu a pak zverejnim
prvni alfa verzi.

> Predem dekuji za pomoc.
>
> S pozdravem -
>               Michal Hucik
>

Zdenek Wagner
e-mail: wagner at cesnet.cz

see also http://hroch486.icpf.cas.cz/wagner/
         http://icebearsoft.euweb.cz




More information about the csTeX mailing list