[cstex] Kopírování češtiny z PDF

Pavel Striz striz at fame.utb.cz
Thu Feb 16 09:03:39 CET 2012


Alternativně lze pracovat s volbou CJKbookmarks při balíčku hyperref.
http://www.tug.org/applications/hyperref/ftp/doc/manual.pdf

Pro záložkové příznivce lze doporučit balíček bookmark, který umí na záložky barvu, řezy bold/italic i z nich udělat hyperlink. Je to poměrně příjemné oživení PDF. Ještě jsem experimentálně nevyzkoušel, ale podobně by na tom měl být i balíček navigator.
http://ftp.cstug.cz/pub/tex/CTAN/macros/latex/contrib/oberdiek/bookmark.pdf
http://ftp.cstug.cz/pub/tex/CTAN/macros/generic/navigator/navigator-doc.pdf

Hezký den od ps



  ----- Original Message ----- 
  From: Petr Sojka 
  To: Czech and Slovak TeX-related mailing list 
  Sent: Thursday, February 16, 2012 1:02 AM
  Subject: Re: [cstex] Kopírování češtiny z PDF


  On Wed, Feb 15, 2012 at 11:59:23PM +0100, Tomas Davidek wrote:
  Dobrý večer,
  >   já jsem narazil na možná trochu související problém. Mám dokument,
  > který překládám pomocí cslatex a vyrábím z něj pdf pomocí dvipdf
  > (použít přímo pdflatex neumím, protože z některých EPS obrázků
  > potřebuji vyřezat netriviální části, na což používám \psclip).
  > Diakritika se mi v PDF zobrazuje i kopíruje správně, ovšem acrobat
  > zobrazuje v levé části automaticky i obsah (bookmarks), kde je už
  > diakritika neúplná. Písmenka s háčky se zobrazují bez háčků,
  > kupodivu se ale "ž" zobrazuje i v tomto navigačmím obsahu správně.
  > Čitelné to sice je, ale k dokonalosti trocha chybí....

  Záložky jsou technicky jiný problém: PDF formát je ukládá
  jen jako textový řetězec, není možno určit font, kterým
  je zobrazován ani ho do PDF vložit, a je to tedy 
  (u _portable_ document formátu) bohužel neportabilní 
  (zobrazení záložek je závislé na systémovém fontu daného OS).
  Adobe tedy od jisté verze PDF specifikace aspoň umožňuje
  záložkové řetězce ukládat jako Unicode string (začínající
  dvoubytem FEFF). To podporuje hyperref v option unicode
  a další makrobalíky.
  Takže to začne fungovat když
  -- třeba s pomocí balíku hyperref a příbuzných (od H. Oberdiek)
     zajistíte, aby texty do záložek expandovaly do správných 
     Unicode řetězců
  &&
  -- čtenář bude mít na svém stroji pro zobrazení těchto řetězců
     dostačující systémový font
  Příklad LaTeXové hlavičky již ponechávám laskavému čtenáři jako 
  cvičení ;-).

  Nic holt není dokonalé, ani portabilita portabilního formátu :-(.

  S pozdravem
  Petr Sojka
     
  > Hlavička vypadá standardně:
  > \usepackage[utf8]{inputenc}
  > \usepackage{czech}
  > (zkoušel jsem i použití \usepackage[T1]{fontenc}, ale 68dn7 efekt to
  > nemělo).
  > 
  > Nemáte s tím prosím někdo nějaké zkušenosti?
  > 
  > Zdraví
  >                Tomáš Davídek
  > 
  > On 02/15/2012 10:37 PM, Robert Marik wrote:
  > >Ahoj Petre, zkus http://tilia.wikidot.com/diakritika-v-pdf
  > >Robert
  > >
  > >2012/2/15 petr zemánek<petr.zemanek at gmail.com>:
  > >>Dobrý den,
  > >>měl bych dotaz ohledně nastavení pro pdfLaTeX, aby bylo možné korektně
  > >>kopírovat text z PDF souboru. Používat toto nastavení
  > >>
  > >>\usepackage[utf8]{inputenc}
  > >>\usepackage[T1]{fontenc}
  > >>\usepackage[czech]{babel}
  > >>\usepackage{mathptmx}
  > >>
  > >>A když zkopíruji text "Plné jméno autora včetně titulů" (takto je i
  > >>zadán ve zdrojovém souboru; ale předpokládám, ze zadání pomocí \v{c}
  > >>apod., by ke změně nevedlo), tak dostanu toto
  > >>
  > >>Plné jméno autora vˇcetnˇe titul°u
  > >>
  > >>Je to možné docílit správného kopírování?
  > >>
  > >>S pozdravem
  > >>Petr Zemánek
  _______________________________________________
  csTeX mailing list
  csTeX at cs.felk.cvut.cz
  http://lists.felk.cvut.cz/mailman/listinfo/cstex
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://lists.felk.cvut.cz/pipermail/cstex/attachments/20120216/4d505375/attachment-0003.html>


More information about the csTeX mailing list