PDF (PS) to text

Zdenek Wagner wagner at cesnet.cz
Wed Jan 21 11:47:09 CET 2004


On Wed, 21 Jan 2004, Luboš Kloc wrote:

> Problem je v tom uvedomit si, ze proste neexistuje osmibitove kodovani,
> do ktereho lze "korektne" prevest vsechny znaky, ktere mohou byt ve
>  vysazenem textu DVI/PS/PDF.
>
> Autorem zminovany priklad: odrazka seznamu pomoci \circle
> se neprevede korektne do IL2. V tomto pripade by snad bylo
> mozno povazovat za jakztakz korektni namapovani na pozici
> 0xB0 (DEGREE SIGN), ale stacilo by pouzit misto \circle treba
> \bullet a zadna odpovidajici pozice v IL2, kam by se dal takovy znak
> korektne namapovat, uz neexistuje.
> Takze lze bud:
> - Uz pri priprave sazby dbat na to, aby tam byly jen znaky obsazene
>    v IL2, nebo
> -  Neprevadet do IL2, ale do Unicode, nebo
> -  Smirit se s tim, ze nektere znaky "korektne" do IL2 prevest nelze
>    (napr vetsinu matematickych znaku a symbolu).
>
Daleko prirozenejsi, nez takove dodatecne cviky s nahradou znaku, je
uvaha, jak uz behem pripravy textu vse osetrit. Pokud jsem dostal jiz
hotovy text od nekoho jineho, pak to muze byt tezke. Pokud sam rozhoduji o
tom, jak se bude text porizovat, pak bych jiz na zacatku pouzil XML a
pomoci XSLT (pripadne FO) z nej mohu dostat cokoliv (TeXovy zdrojak, RTF,
PDF, plain text, HTML, XHTML, man page, ...). Neni nutne se rovnou ucit
DocBook, muzete si vymyslet i vlastni znacky. Podrobnejsi informace
najdete ve Zpravodajich a treba v knize "XML pro kazdeho" od J. Koska.

> Lubos Kloc
>
> Zdenek Wagner wrote:
>
>  > Pokud by znaky nemusely byt v Unicode a byl problem jen v tom, ze ruzne
>
> >fonty maji ruzne kodovani a ze se akcentovane znaky skladaji ze
> >smostatneho pismene a samostatneho akcentu, pak je schudna cesta z DVI
> >pouzitim dvispell z emTeXu (nazev je trochu matouci, je to filtr, ktery
> >posle data z DVI do spellchecku). Je mozno dvispell nakonfigurovat tak,
> >aby pro kazdy font pouzil jinou prevodni tabulku.
> >
> >
>
>
>

Zdenek Wagner
e-mail: wagner at cesnet.cz

see also http://hroch486.icpf.cas.cz/wagner/
         http://icebearsoft.euweb.cz





More information about the csTeX mailing list