"Prohledavatelne" PDF soubory

Zdenek Wagner - Ustav chemickych procesu AV wagner at cesnet.cz
Mon Sep 11 15:12:09 CEST 2000


On Mon, 11 Sep 2000, Radim Gelner wrote:

> Na zaklade sveho predchoziho prispevku bych zde rad polozil dotaz
> tykajici se prohledavani PDF souboru.
>
> Cilem meho (a asi nejenom meho) snazeni je mit PDF soubor, ktery je
> mozne prohledavat a provadet v nem cut&paste na ruznych platformach.
>
> Zatim jsem dosel tak daleko, ze dokazu vytvorit soubor, ktery lze
> prohledavat a c&pastovat v Acrobat Readeru pod Linuxem. Pod Windows
> to ale nefunguje.
>
Potiz je v tom, ze kazdy system ma jine kodovani fontu. Unix pouziva ISO
8859-2, Windows v grafickem prostredi maji CP1250, Windows v textovem
rezimu, MSDOS a OS/2 maji CP852, Macintosh ma take jine kodovani. PS font
muze mit zcela libovolne kodovani. Programy, ktere tvori PS nebo PDF, musi
umet prekonvertovat systemove kodovani na kodovani prislusneho PS fontu
(napr. dvips to dela, pokud to jiz jinymi prostredky neprovedl TeX). V
zasade mohu mit ve stejnem dokumentu dva PS fonty s ruznym kodovanim a vse
se zobrazi spravne. Totez plati pro PDF. Pri prohledavani musim tedy text
zadany z klavesnice prevest do kodovani prislusneho fontu (a pro kazdy
font to muze byt jiny retezec). Navic v PDF muze byt font vlozen jako
"embedded subset". Necetl jsem PDF Reference Manual dukladne a nevim, zda
je i v takovych fontech ulozen /Encoding. Bez symbolickych jmen se takove
prekodovani bude programovat tezko.

Vsechny Zpravodaje CSTUGu jsou distilovany z PS do PDF Acrobatem 4 ve
Windows 98 (anglickych), pouzivaji CS fonty v PFB a jsou "embedded
subset". Kodovani v cs*.pfb je v dolni pulce jako u CM fontu, horni pulka
je podle ISO 8859-2, ale protoze jsou vkladany jako subset, muze byt
skutecne kodovani v kazdem cisle jine.


Zdenek Wagner
e-mail: wagner at mbox.cesnet.cz  or  wagner at icpf.cas.cz

see also http://www.icpf.cas.cz/wagner/
         http://members.xoom.com/z_wagner/




More information about the csTeX mailing list