PDF (PS) to text

Luboš Kloc kloc at ipm.cz
Wed Jan 21 11:37:08 CET 2004


Problem je v tom uvedomit si, ze proste neexistuje osmibitove kodovani,
do ktereho lze "korektne" prevest vsechny znaky, ktere mohou byt ve
 vysazenem textu DVI/PS/PDF.

Autorem zminovany priklad: odrazka seznamu pomoci \circle
se neprevede korektne do IL2. V tomto pripade by snad bylo
mozno povazovat za jakztakz korektni namapovani na pozici
0xB0 (DEGREE SIGN), ale stacilo by pouzit misto \circle treba
\bullet a zadna odpovidajici pozice v IL2, kam by se dal takovy znak
korektne namapovat, uz neexistuje.
Takze lze bud:
- Uz pri priprave sazby dbat na to, aby tam byly jen znaky obsazene
   v IL2, nebo
-  Neprevadet do IL2, ale do Unicode, nebo
-  Smirit se s tim, ze nektere znaky "korektne" do IL2 prevest nelze
   (napr vetsinu matematickych znaku a symbolu).

Lubos Kloc

Zdenek Wagner wrote:

 > Pokud by znaky nemusely byt v Unicode a byl problem jen v tom, ze ruzne

>fonty maji ruzne kodovani a ze se akcentovane znaky skladaji ze
>smostatneho pismene a samostatneho akcentu, pak je schudna cesta z DVI
>pouzitim dvispell z emTeXu (nazev je trochu matouci, je to filtr, ktery
>posle data z DVI do spellchecku). Je mozno dvispell nakonfigurovat tak,
>aby pro kazdy font pouzil jinou prevodni tabulku.
>
>






More information about the csTeX mailing list