Re: pdftotext problem

Dan B Daniel.Bar at seznam.cz
Mon Oct 27 10:49:50 CET 2003


================= Původní zpráva =================
Od (From): "Luboš Kloc" <kloc at IPM.CZ>
Komu (To): csTeX at cs.felk.cvut.cz
Kopie (Cc):
Předmět (Subject): Re: pdftotext problem
Datum (Date): 27. 10. 2003 10:10
==================================================


> > >
> > > Mohl byste mi nekdo poradit kde je problem, resp. nejakou univerzalne
> > > pouzitelnou metodu?
>
>
> Otazka 4) patrne zadne obecne reseni nema. (Snad jen aplikace nejake OCR
> techniky na vykreslene glyfy.) Jedinou cestou muze byt dodani prislusne
> chybejici informace zvenci, pokud se podari odhadnout, zkusmo urcit nebo
> vycist z obsazenych informaci kodovani pouziteho fontu.
>

To by zrejme vyzadovalo manualni korekce (?) coz pri uvazovane aplikaci bohuzel neni mozne/ realne. Prevodnik pdftotext pouzivam jako externi parser pro ht://Dig indexer, a jelikoz se jedna o nekolik set PDF souboru, zrejme se budu muset smirit s obcasnymi pokrivenymi prevody.

Dik za odpovedi

Dan

____________________________________________________________
Vyšší bezpečnost připojení znamená nižší náklady spojené s odstraňováním následků útoků z internetu. http://ad2.seznam.cz/redir.cgi?instance=63341%26url=http://www.contactel.cz/bezpecnyinternet




More information about the csTeX mailing list