Konverze PostScriptu (PDF) do TXT

Milos Balcarik milos.balcarik at berit.cz
Tue Jul 18 10:24:07 CEST 2000


Dobry den,


dokumentaci v PDF delam cca 5 let.

Postupne jsem pouzival ruzne verze M$ Wordu pod WinNT
a vzdy jen fonty True Type.
Obcas se ale autorum stalo, ze vychozi wordovsky dokument ztratili...
Proto moje PDF vzdy umoznuji zpetny prevod do ASCII textu
a to pomoci postupu: Select All, CTRL+C, CTRL+V.


Aby to bylo mozne, je nutne pouzit jednak tisk do (virtualni) PS tiskarny
(napr. Distiller anebo Default PS Printer) a to pres originalni ovladace
od ADOBE (volne ke stazeni na jejich webu).
Potom se to prozene programem Distiller a je PDF hotovo.


Dnes pouzivam tyto verze SW -- vse je zadax na webu Adobe:
-- Adobe Universal Installer 1.0 (PSENG_10.EXE), ktery obsahuje:
    -- AdobePS 4.4.0 pro Win 95/98
    -- AdobePS 5.1.2 pro Win NT 4.0
    -- Adobe PS 5 pro Win 2000
-- Instalacni PPD soubory pro virtualni tiskarny Adobe (ADOBE.EXE):
    -- Distiller 3.1
    -- Default PS Printer


Ukazkove nastaveni virtualni PS tiskarny ve Win NT:

Driver:
-- AdobePS Acrobat Distiller
(z baliku ovladacu PostScript 5.1.2, build 105, Adist4.ppd)

Printers/Properties/Device Settings:
-- Minimum Font Size to Download as Outline = 5 pixels

Printers/Document Defaults/Advanced:
-- Graphics/TrueType Font: Download as Softfont
-- PostScipt Options/PS Output Option: Optimize for Portability
-- PostScipt Options/TrueType Font Download Option: Outline

Vysledny tiskovy PS soubor se prozene Distillerem a vznikle PDF je:
-- hezky cesky s diakritikou
-- pismo je vektorove a ne bitmapova zubata hruza
-- vyhledavat lze (ale bez diakritiky v retezcich -- to je chyba Adobe)
-- clipboard FUNGUJE korektne


M.B.

----- Původní zpráva -----
Od: Pavel Hofman <pavel.hofman at insite.cz>
Komu: <cstex at cs.felk.cvut.cz>
Odesláno: 13. července 2000 18:21
Předmět: Konverze PostScriptu (PDF) do TXT


> Dobry den,
>
> jsem si vedom, ze se muj dotaz netyka primo TeXu, ale tuto konferenci
> sleduje rada odborniku na PostScript.
>
> Konverze postscriptu (prip. pdf) vytvoreneho z TeXu do txt neni velky
> problem (vcetne cestiny). Potrebuji vsak zkonvertovat vetsi mnozstvi PDF
> souboru vyrobenych klasickym postupem ve Windows - tisk z Wordu 97 do PS
> a pote konverze do PDF pomoci Acrobat Distilleru.
>
> Problem je, ze jiz z postscriptoveho souboru nelze text rozumne
> vytahnout (tisk pres originalni MS drivery (Apple LaserWriter, HP
> LaserJet 4M/PS) i pres Adobe PS driver) - ceske znaky zpusobuji, ze na
> vystupu pstotext, ps2ascii jsou naproste nesmysly. Vzdy cast radky je
> OK, ale pak nasleduje i nekolik odstavcu nesmyslu. Po prevodu takoveho
> souboru do PDF Distillerem (nebo ps2pdf ci cimkoliv jinym) je tudiz
> logicke, ze ani PDF soubor nelze tez zkonvertovat.
>
> Proto by me zajimalo, zda ma nekdo s timto nejake zkusenosti, pripadne
> zda by nekdo nevedel:
>
> 1. jake jsou moznosti konverze techto PS souboru vytvorenych ve Windows
>
> 2. pripadne jak pod Windows vytvorit z Wordu 95/97 takovy PS soubor,
> ktery by bylo mozno prevest zpet na text s ceskymi znaky (predpokladam,
> ze PDF vyrobeny z tohoto PS by jiz nemel delat problemy).
>
> Dekuji za Vase nazory.
>
> Pavel Hofman.
>





More information about the csTeX mailing list