[cstex] Kopírování češtiny z PDF

Petr Sojka sojka at fi.muni.cz
Thu Feb 16 01:02:46 CET 2012


On Wed, Feb 15, 2012 at 11:59:23PM +0100, Tomas Davidek wrote:
Dobrý večer,
>   já jsem narazil na možná trochu související problém. Mám dokument,
> který překládám pomocí cslatex a vyrábím z něj pdf pomocí dvipdf
> (použít přímo pdflatex neumím, protože z některých EPS obrázků
> potřebuji vyřezat netriviální části, na což používám \psclip).
> Diakritika se mi v PDF zobrazuje i kopíruje správně, ovšem acrobat
> zobrazuje v levé části automaticky i obsah (bookmarks), kde je už
> diakritika neúplná. Písmenka s háčky se zobrazují bez háčků,
> kupodivu se ale "ž" zobrazuje i v tomto navigačmím obsahu správně.
> Čitelné to sice je, ale k dokonalosti trocha chybí....

Záložky jsou technicky jiný problém: PDF formát je ukládá
jen jako textový řetězec, není možno určit font, kterým
je zobrazován ani ho do PDF vložit, a je to tedy 
(u _portable_ document formátu) bohužel neportabilní 
(zobrazení záložek je závislé na systémovém fontu daného OS).
Adobe tedy od jisté verze PDF specifikace aspoň umožňuje
záložkové řetězce ukládat jako Unicode string (začínající
dvoubytem FEFF). To podporuje hyperref v option unicode
a další makrobalíky.
Takže to začne fungovat když
-- třeba s pomocí balíku hyperref a příbuzných (od H. Oberdiek)
   zajistíte, aby texty do záložek expandovaly do správných 
   Unicode řetězců
&&
-- čtenář bude mít na svém stroji pro zobrazení těchto řetězců
   dostačující systémový font
Příklad LaTeXové hlavičky již ponechávám laskavému čtenáři jako 
cvičení ;-).

Nic holt není dokonalé, ani portabilita portabilního formátu :-(.

S pozdravem
Petr Sojka
   
> Hlavička vypadá standardně:
> \usepackage[utf8]{inputenc}
> \usepackage{czech}
> (zkoušel jsem i použití \usepackage[T1]{fontenc}, ale 68dn7 efekt to
> nemělo).
> 
> Nemáte s tím prosím někdo nějaké zkušenosti?
> 
> Zdraví
>                Tomáš Davídek
> 
> On 02/15/2012 10:37 PM, Robert Marik wrote:
> >Ahoj Petre, zkus http://tilia.wikidot.com/diakritika-v-pdf
> >Robert
> >
> >2012/2/15 petr zemánek<petr.zemanek at gmail.com>:
> >>Dobrý den,
> >>měl bych dotaz ohledně nastavení pro pdfLaTeX, aby bylo možné korektně
> >>kopírovat text z PDF souboru. Používat toto nastavení
> >>
> >>\usepackage[utf8]{inputenc}
> >>\usepackage[T1]{fontenc}
> >>\usepackage[czech]{babel}
> >>\usepackage{mathptmx}
> >>
> >>A když zkopíruji text "Plné jméno autora včetně titulů" (takto je i
> >>zadán ve zdrojovém souboru; ale předpokládám, ze zadání pomocí \v{c}
> >>apod., by ke změně nevedlo), tak dostanu toto
> >>
> >>Plné jméno autora vˇcetnˇe titul°u
> >>
> >>Je to možné docílit správného kopírování?
> >>
> >>S pozdravem
> >>Petr Zemánek



More information about the csTeX mailing list