pdftotext problem

Dan Bar Daniel.Bar at seznam.cz
Sun Oct 26 08:34:35 CET 2003


> Pomerne podrobne mi to zkusenejsi objasnili nekdy pred
> rokem v threadu "PDF -> Text". Neco jsem pochopil az nyni
> z threadu "Off topic: LaTeX -> PDF". Zapamatoval jsem si
> z toho, ze jednoduche hotove reseni neexistuje. Neznama
> pdf nelze do textu spolehlive prevadet. Pokud me nekdo
> opravi, budu jen rad.

Precetl jsem si zmineny thread.

Inkriminovany bad.pdf soubor v sobe zrejme opravdu postrada dulezite
informace pro prevod na Unicode. V Acrobat Readeru pod win (a zrejme i
pod Linuxem) se to zobrazi se spravnym kodovanim, coz je ale zrejme jen
diky mapovani na vlozena pisma. Pokud se ale pokusim o cut&paste tak se
pismena s diakritikou prenesou spatne.

Docela by me zajimalo jak takoveto pripady se zmrsenymi PDF resi
(neresi?) indexacni engine na Google.

Dan





More information about the csTeX mailing list