PdfeLateX a extrakce textu z pdf

Pavel Lisý pali at tmapy.cz
Tue Aug 29 10:27:44 CEST 2006


Michal Růžička píše v Po 28. 08. 2006 v 22:38 +0200:
> > Moc děkuji! To je přesně to, co jsem potřeboval. V jiných fórech mi
> > tvrdily, že to nejde - je to prý vlastnost LaTeXu :)
> > 
> > Jakub
> 
> Ještě bych doplnil, že ani balíček cmap.sty ale bohužel neřeší všechny problémy.
>  Viz můj dřívější příspěvek v této skupině. (Podívejte se do nějakého archivu,
> případně momentálně funguje např. tento odkaz:
> http://groups.google.com/group/cz.comp.cstex/browse_thread/thread/218ececfa0f67bb3/362f939092b43399?lnk=st&q=&rnum=1&hl=cs#362f939092b43399).

Ještě k vašemu příspěvku. Zjistil jsem, že existuje druhá možnost. A tou
je použít místo babel pouze czech.sty a překládat pomocí pdfcslatex. Má
to nevýhodu v tom, že např v linuxu/tetexu je třeba opravit tři soubory,
aby se pdf opravdu vytvořilo (v tetex 3.0 je vložena chybná verze
cstexu) a potom pomocí texconfig vygenerovat potřebné formáty. Odměnou
je fungující překlad a menší výsledné pdf. 

Nakonec poznámka. Program Evince (gnome pdf viewer) ve Fedore 5 má velké
problémy s načítáním výsledku při použití babelu, procesor běží na 100%
tak dlouho, že jsem neměl trpělivost čekat, zda nakonec něco zobrazí.
Asi má problém s vloženými fonty (?). Při použití pdfcslatex reaguje
svižně a navíc (na rozdíl od acroread) se po kopírování přes clipboard
nějakým způsobem zachovává formátovací informace. To bylo něco, na co
jste se ve vašem výše citovaném ptal.

Pavel Lisý


> >>> Věřím, že nějaké řešení existuje.
> >> Nastesti ano. Balik cmap.sty.
> >>
> >>> Dokument:
> >>> \documentclass[12pt,a4paper]{article}
> >> \usepackage{cmap}
> >>
> >>> \usepackage[T1]{fontenc}
> >>> \usepackage[latin2]{inputenc}
> >>> \usepackage[czech]{babel}
> >>> \begin{document}
> >>> ...
> >>> \end{document}
> >> Jano Kula






More information about the csTeX mailing list