[cstex] Kopírování češtiny z PDF
Pavel Striz
striz at fame.utb.cz
Thu Feb 16 09:03:39 CET 2012
Alternativně lze pracovat s volbou CJKbookmarks při balíčku hyperref.
http://www.tug.org/applications/hyperref/ftp/doc/manual.pdf
Pro záložkové příznivce lze doporučit balíček bookmark, který umí na záložky barvu, řezy bold/italic i z nich udělat hyperlink. Je to poměrně příjemné oživení PDF. Ještě jsem experimentálně nevyzkoušel, ale podobně by na tom měl být i balíček navigator.
http://ftp.cstug.cz/pub/tex/CTAN/macros/latex/contrib/oberdiek/bookmark.pdf
http://ftp.cstug.cz/pub/tex/CTAN/macros/generic/navigator/navigator-doc.pdf
Hezký den od ps
----- Original Message -----
From: Petr Sojka
To: Czech and Slovak TeX-related mailing list
Sent: Thursday, February 16, 2012 1:02 AM
Subject: Re: [cstex] Kopírování češtiny z PDF
On Wed, Feb 15, 2012 at 11:59:23PM +0100, Tomas Davidek wrote:
Dobrý večer,
> já jsem narazil na možná trochu související problém. Mám dokument,
> který překládám pomocí cslatex a vyrábím z něj pdf pomocí dvipdf
> (použít přímo pdflatex neumím, protože z některých EPS obrázků
> potřebuji vyřezat netriviální části, na což používám \psclip).
> Diakritika se mi v PDF zobrazuje i kopíruje správně, ovšem acrobat
> zobrazuje v levé části automaticky i obsah (bookmarks), kde je už
> diakritika neúplná. Písmenka s háčky se zobrazují bez háčků,
> kupodivu se ale "ž" zobrazuje i v tomto navigačmím obsahu správně.
> Čitelné to sice je, ale k dokonalosti trocha chybí....
Záložky jsou technicky jiný problém: PDF formát je ukládá
jen jako textový řetězec, není možno určit font, kterým
je zobrazován ani ho do PDF vložit, a je to tedy
(u _portable_ document formátu) bohužel neportabilní
(zobrazení záložek je závislé na systémovém fontu daného OS).
Adobe tedy od jisté verze PDF specifikace aspoň umožňuje
záložkové řetězce ukládat jako Unicode string (začínající
dvoubytem FEFF). To podporuje hyperref v option unicode
a další makrobalíky.
Takže to začne fungovat když
-- třeba s pomocí balíku hyperref a příbuzných (od H. Oberdiek)
zajistíte, aby texty do záložek expandovaly do správných
Unicode řetězců
&&
-- čtenář bude mít na svém stroji pro zobrazení těchto řetězců
dostačující systémový font
Příklad LaTeXové hlavičky již ponechávám laskavému čtenáři jako
cvičení ;-).
Nic holt není dokonalé, ani portabilita portabilního formátu :-(.
S pozdravem
Petr Sojka
> Hlavička vypadá standardně:
> \usepackage[utf8]{inputenc}
> \usepackage{czech}
> (zkoušel jsem i použití \usepackage[T1]{fontenc}, ale 68dn7 efekt to
> nemělo).
>
> Nemáte s tím prosím někdo nějaké zkušenosti?
>
> Zdraví
> Tomáš Davídek
>
> On 02/15/2012 10:37 PM, Robert Marik wrote:
> >Ahoj Petre, zkus http://tilia.wikidot.com/diakritika-v-pdf
> >Robert
> >
> >2012/2/15 petr zemánek<petr.zemanek at gmail.com>:
> >>Dobrý den,
> >>měl bych dotaz ohledně nastavení pro pdfLaTeX, aby bylo možné korektně
> >>kopírovat text z PDF souboru. Používat toto nastavení
> >>
> >>\usepackage[utf8]{inputenc}
> >>\usepackage[T1]{fontenc}
> >>\usepackage[czech]{babel}
> >>\usepackage{mathptmx}
> >>
> >>A když zkopíruji text "Plné jméno autora včetně titulů" (takto je i
> >>zadán ve zdrojovém souboru; ale předpokládám, ze zadání pomocí \v{c}
> >>apod., by ke změně nevedlo), tak dostanu toto
> >>
> >>Plné jméno autora vˇcetnˇe titul°u
> >>
> >>Je to možné docílit správného kopírování?
> >>
> >>S pozdravem
> >>Petr Zemánek
_______________________________________________
csTeX mailing list
csTeX at cs.felk.cvut.cz
http://lists.felk.cvut.cz/mailman/listinfo/cstex
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://lists.felk.cvut.cz/pipermail/cstex/attachments/20120216/4d505375/attachment-0003.html>
More information about the csTeX
mailing list