Prevod z PDF

Tomas Davidek davidek at hp01.troja.mff.cuni.cz
Mon Jan 19 09:57:39 CET 1998


On Sun, 18 Jan 1998, Michal Kubecek wrote:

> > mam trochu odtazity problem, ale snad mi nekdo poradi.
> > Kamarad potrebuje prevest nejake texty z PDF do Wordu a marne hleda
> > nejaky vhodny nastroj (Word samozrejme takovy import neumoznuje).
> > Stacil by mu i prevod PDF -> RTF, z toho to uz do Wordu dostane.
>
> Tezko, v PDF uz prakticky nemate sanci poznat ani co je slovo.
> PDF je v podstate PostScript oskubany o programovaci konstrukce
> a obohaceny o podporu hypertextu. Tato uloha neni IMHO
> algoritmizovatelna. Tim netvrdim, ze neexistuje nejaka aproximace.
> Zkusil bych PDF -> PS a pak hledat neco, co z PostScriptu vydoluje
> cisty text. PostScript je starsi a zavedenejsi, takze je u nej
> vetsi sance, ze neco takoveho bude existovat.
>

Z PostScriptu lze vydolovat cisty text napr. pomoci utility pstotext
(existuje napr. na Linuxu, ale urcite i na jinych platformach). Prevod PDF
-> PS by mel byt bez problemu (Acrobat to zvlada).

Zdravi
           Tomas Davidek


 E-mail : davidek at hp01.troja.mff.cuni.cz
          (davidek at hp02.troja.mff.cuni.cz)
          (davidek at hp03.troja.mff.cuni.cz)




More information about the csTeX mailing list