ToUnicode
Zdenek Wagner
wagner at cesnet.cz
Fri Dec 29 21:38:24 CET 2006
2006/11/13, Vit Zyka <vit.zyka at seznam.cz>:
> Zdenek Wagner wrote:
> > Vazeni kolegove,
> > dozvedel jsem se, ze mapovani mezi glyfy a unicodovymi znaky v PDF lze
> > zaridit i jinak nez pres cmap.sty, a to primo vkladanim \pdfliteral,
> > jen jsem nezjistil detaily. vyuzitim konceptu textemu z Omegy by slo
> > vyresit problemy, ktere cmap.sty v principu neumi. Nemate nekdo namet,
> > co si mam nastudovat?
> >
> > Predem dekuji
>
> No nevim, zda je to, co chcete slyset, ale kdyz nastudujete jak je
> naprogramovane cmap.sty, tak uvidite, jak se pomoci \pdfliteral vkladaji
> potrebne PDF tagy. Principialne jde ale o totez, talze si myslim, ze
> nedostanete takto vyssi kvalitu, o ktere se zminujete.
>
Podarilo se mi tu alternativni metodu najit ve specifikaci PDF. Dela
se to pomoci:
/Span <</ActualText (nahradni text)>> BDC (vysazeny text) Tj EMC
Cast mezi BDC a EMC doplni pdfTeX, zbytek se doda snadno pomoci
\pdfliteral. Problem je v tom, ze (nahradni text) nebere Unicodove
znaky, takze pro indicke jazyky mi to vubec nepomuze :-(
Adobe to zamysli napriklad kvuli tomu, aby slo najit nemecke slovo
Drucker, kdyz je rozdeleno na Druk-/ker. V pdfTeXu by se to zaridilo
pomoci:
Dru\pdfliteral{/Span <</ActualText (c)>> BDC
}\discretionary{k-}{}{c}\pdfliteral{ EMC }ker
--
Zdeněk Wagner
http://hroch486.icpf.cas.cz/wagner/
http://icebearsoft.euweb.cz
More information about the csTeX
mailing list