ToUnicode

Zdenek Wagner wagner at cesnet.cz
Fri Dec 29 21:38:24 CET 2006


2006/11/13, Vit Zyka <vit.zyka at seznam.cz>:
> Zdenek Wagner wrote:
> > Vazeni kolegove,
> > dozvedel jsem se, ze mapovani mezi glyfy a unicodovymi znaky v PDF lze
> > zaridit i jinak nez pres cmap.sty, a to primo vkladanim \pdfliteral,
> > jen jsem nezjistil detaily. vyuzitim konceptu textemu z Omegy by slo
> > vyresit problemy, ktere cmap.sty v principu neumi. Nemate nekdo namet,
> > co si mam nastudovat?
> >
> > Predem dekuji
>
> No nevim, zda je to, co chcete slyset, ale kdyz nastudujete jak je
> naprogramovane cmap.sty, tak uvidite, jak se pomoci \pdfliteral vkladaji
> potrebne PDF tagy. Principialne jde ale o totez, talze si myslim, ze
> nedostanete takto vyssi kvalitu, o ktere se zminujete.
>
Podarilo se mi tu alternativni metodu najit ve specifikaci PDF. Dela
se to pomoci:

/Span <</ActualText (nahradni text)>> BDC (vysazeny text) Tj EMC

Cast mezi BDC a EMC doplni pdfTeX, zbytek se doda snadno pomoci
\pdfliteral. Problem je v tom, ze (nahradni text) nebere Unicodove
znaky, takze pro indicke jazyky mi to vubec nepomuze :-(

Adobe to zamysli napriklad kvuli tomu, aby slo najit nemecke slovo
Drucker, kdyz je rozdeleno na Druk-/ker. V pdfTeXu by se to zaridilo
pomoci:

Dru\pdfliteral{/Span <</ActualText (c)>> BDC
}\discretionary{k-}{}{c}\pdfliteral{ EMC }ker



-- 
Zdeněk Wagner
http://hroch486.icpf.cas.cz/wagner/
http://icebearsoft.euweb.cz




More information about the csTeX mailing list