pdftotext problem

Zdenek Wagner wagner at cesnet.cz
Mon Oct 27 10:20:43 CET 2003


On Mon, 27 Oct 2003, Luboš Kloc wrote:

> Myslim, ze pro nas TeXisty je klicova otazka 2) a musime ji vyresit. Meli
> bychom
> byt schopni vytvaret PDF soubory v souladu se standardem.
>
Standard PDF ma i nepovinne soucasti a je otazka, ktere z techto
nepovinnych soucasti chceme z TeXu generovat. Napriklad se do PDF da
vlozit strukturnu informace, ktera umoznuje, ze se PDF da prevest do XML.

> Otazka 4) patrne zadne obecne reseni nema. (Snad jen aplikace nejake OCR
> techniky na vykreslene glyfy.) Jedinou cestou muze byt dodani prislusne
> chybejici
> informace zvenci, pokud se podari odhadnout, zkusmo urcit nebo vycist
> z obsazenych informaci kodovani pouziteho fontu.
>
Dal by se udelat program, ktery by v prvnim kroku prevedl text na PS jmena
pouzitych znaku a v druhem kroku by podle informace o kodovani vytvoril
text. V nekterych pripadech maji tvurci firmu spaten jmena znaku, ale dany
tvurce to ma u vsech fontu stejne spatne. Pak by se pro fonty tohoto
tvurce dala udelat jedna prevodni tabulka.

> Lubos Kloc
>
>
>

Zdenek Wagner
e-mail: wagner at cesnet.cz

see also http://hroch486.icpf.cas.cz/wagner/
         http://icebearsoft.euweb.cz





More information about the csTeX mailing list