Jak dostat české znaky z pdf

Vlastimil Ott tex at e-ott.info
Sun Apr 9 16:01:37 CEST 2006


Pavel Lisý napsal(a):

> Dá se to nějak vyřešit?

Ano. Balík xpdf obsahuje utilitu pdftotext, která to umí. Je ale nutné 
stáhnout si lokalizační balíček:

http://www.foolabs.com/xpdf/download.html
ftp://ftp.foolabs.com/pub/xpdf/xpdf-latin2.tar.gz

Na konec .xpdfrc potom dopiste:

  cat .xpdfrc | grep unicode
unicodeMap      Latin2  /usr/share/xpdf/latin2/Latin2.unicodeMap


> Lze k tomu nějak přesvědčit pdftex/pdflatex. Nebo existuje prošlapaná
> cesta jinudy? Např. přes konverzi do html, resp. rtf? 

Já bych to celé dělal v DocBooku a na požádání generoval buď HTML, nebo 
tiskovou kvalitu TeXem. Nebo obyčejný (trochu formátovaný) text.
> 
> Jde mi o to, aby v tom nějakým způsobem zůstala i formátovací informace.

Tak to nevím, jestli se vám povede, pdftotext to seká, jak to čte...

--vo





More information about the csTeX mailing list