PDF -> Text

oldfrog oldfrog.mail.tex1 at volny.cz
Wed Jul 24 18:23:02 CEST 2002


>
>
>Z vyse uvedeneho plyne, ze nejjistejsi je donutit kazdou aplikaci vytvarejici
>PDF, aby ke kazde definici fontu pridala i polozku ToUnicode. A pokud rozklada
>znak do vice znaku (akcent+zakladni znak), tak navic musi spolehat na to, ze
>pdftotext umi skladat znaky podle UNICODE, tj. ze umi poznat kombinaci
>akcent+znak a nahradit ji ve vystupnim kodovani akcentovanym znakem.
>
Lze to nejak realizovat v pdfTeXu? Bohuzel bych docela potreboval
prevadet pdf vytvorena
v pdfTeXu do cisteho textu - kvuli indexaci ve vyhledavacim stroji
htdig. A jak jsem rekl,
funguje to jen s Computer Modern fonty, coz mne dost omezuje...

Prilis se ve specifikaci fontu nevyznam, nicmene nemuze to byt treba
rozdilnym kodovanim
fontu Adobe a ComputerModern? Nebo skutecne Adobe fonty neobsahuji ceske
znaky?
Pouzivam distribuci teTeX na SuSE linuxu 8.0cz.

V podstate by mi stacila nejaka funkcni alternativa k Adobe fontum, jde
mi hlavne o Helveticu
(phv), Times (ptm) a Bookman (pbk).

>P.S.: Dalsi problem je, ze polozky jako bookmarky a anotace jsou podle
>specifikace v PDFDocEncoding, coz je opet iso-8859-1 (resp. jeji nadstavba) a
>tudiz pokus cspdftexu o ceske texty v bookmarkach jsou opet odsouzeny k
>neuspechu.
>
Taky jsem si vsiml. V linuxu vidim bookmarky i s cestinou, ale ve
Windows je to pokazene...

Dekuji moc za predesle a
eventuelne i nasledujici reakce,

OldFrog
(Ondra Nemecek).








More information about the csTeX mailing list