PDF -> Text

oldfrog oldfrog.mail.tex1 at volny.cz
Wed Jul 24 20:13:57 CEST 2002


>
>
>>Lze to nejak realizovat v pdfTeXu?
>>
>>
>Popis problemu kolegy Vancury byl velmi presny.
>Pridavat polozku ToUnicode lze v pdftexu jiz cca dva roky,
>Thanh tam tehdy na mou zadost pridal primitiv, ktery umoznuje
>pridat prislusny CMAP (character mapping) k pouzitemu fontu.
>Tim se aplikace ctouci PDF (Reader, pdftotext/htdig) teprve dozvi
>jednoznacne ktere znaky (Unicode) odpovidaji sekvencim sazenych
>glyphu (na samotne nazvy glyphu se vetsinou nelze moc spolehnout).
>Nechce se nekomu ty cmap soubory pripadne dalsi podporu maker
>pro casto pouzivane sady fontu vytvorit a venovat do sirene
>distribuce (texlive)?
>
>>Bohuzel bych docela potreboval
>>prevadet pdf vytvorena
>>v pdfTeXu do cisteho textu - kvuli indexaci ve vyhledavacim stroji
>>htdig. A jak jsem rekl,
>>funguje to jen s Computer Modern fonty, coz mne dost omezuje...
>>
>>
>A funguji i ligatury?
>
font - ligatura - pdftotext:

cms - ano - ano
cmss - ne (asi ani nema ?) - ano
cmr - ano -ano
cmtt - ne - ano

ptm - ano - ne
phv - ne - ne
ppl - ne - ne
pcr - ne - ne

Pokud je u pdftotext uvedeno "ne", znamena to, ze se provedla
konverze, jejimz vysledkem bylo neco jako s\v{}as\v{}ek; tj.
nejdrive pismenko a pak hacek (slovo sasek).

Co z toho lze vysoudit?

Dik,
OldFrog.










More information about the csTeX mailing list