[cstex] Prohledovatelné a kopírovatelné pdf, fonty

Zdenek Wagner zdenek.wagner at gmail.com
Mon Dec 11 11:55:29 CET 2017


Dobrý den,

na vstupním kódování nezáleží, to není v hotovém PDF nikde viditelné, ale
kromě správného mapování balíčkem cmap záleží ještě na prohlížeči PDF.
Přestože toUnicode i ActualText jsou dokumentované vlastnosti, nejsou
implementovány ve všech prohlížečích.

Zdeněk Wagner
http://ttsm.icpf.cas.cz/team/wagner.shtml
http://icebearsoft.euweb.cz

Dne 11. prosince 2017 10:02 Michal Růžička <xruzick7 at fi.muni.cz> napsal(a):

> Podstatné je v PDF nechat vyznačit mapování glyfů na unicode znaky. Je
> možné k tomu využít LaTeXový balíček „cmap“. Pro překlad pdflatexem mám
> osvědčenou hlavičku:
>
> > % Začátek preambule.
> > \documentclass{article} % Mezi nejdůležitější třídy dokumentů patří
> article,
> >                         % book a report. Třída dokumentů určuje např.
> to, že
> >                         % článek (article) nemá (na rozdíl od knihy)
> příkazy pro
> >                         % sazbu kapitol apod.
> > \usepackage[resetfonts]{cmap} % Při překladu pdfTeXem do PDF zajistí
> správné
> >                               % mapování znaků na Unicode sekvence a
> učiní tak
> >                               % text prohledávatelný a kopírovatelný do
> schránky.
> > \usepackage{lmodern} % Sázet se bude Latin Modern fonty, nikoli výchozími
> >                      % EC fonty.
> > \usepackage[czech]{babel} % Nastavení použití českého prostředí pro
> LaTeX.
> >                           % Dokument přeložíme příkazem 'latex <název
> souboru>'
> >                           % či 'pdflatex <název souboru>'.
> > \usepackage[latin2]{inputenc} % Informace o tom, že tento zdrojový text
> je
> >                               % uložen v kódování ISO 8859-2 (někdy
> označovaném
> >                               % jako ISO Latin 2).
> > \usepackage[T1]{fontenc} % Nastavení kódování fontu na formát T1.
> > % Konec preambule.
> >
> > % Začátek dokumentu.
> > \begin{document}
>
> Pro „inputenc“ je samozřejmě potřeba nastavit kódování, ve kterém je
> zdrojový text skutečně uložen.
>
> --mr
>
>
> Dne 11.12.2017 v 8:35 Luboš Kloc napsal(a):
> > Dobrý den,
> >
> > ono hlavně záleží na tom, jak má být čeština kódována v tom textovém
> > souboru. Používáte font kódovaný v T1 a to asi mimo TeXové prostředí
> > opravdu nebude fungovat.
> >
> > Podle ukázky soudím, že pro textové soubory používáte kódování cp1250,
> > což už je dnes hodně zastaralé (neznám Windows, ale snad už dnes
> > systémově používají nějakou verzi utf). Nevím, zda existuje TeXový font
> > kódovaný v cp1250, přibližně by tomu mohly odpovídat cs fonty v OT1, ale
> > opravdu jen přibližně.
> >
> > Pokud netrváte na TeXových fontech, pak by asi bylo nejschůdnější použít
> > XeLaTeX s nějakým systémovým fontem.
> >
> > S pozdravem,
> >
> > Luboš Kloc
> >
> >
> >
> > Dne 10.12.2017 v 16:21 Vaclav Vopravil napsal(a):
> >> Dobrý den,
> >>
> >> používám LaTeX, kompiluji latex --> dvips --> ps2pdf, na čtení
> >> výsledného souboru pdf používám Foxit Reader.
> >> Potřeboval bych, abych ve výsledném souboru mohl použít CTRL+C a CTRL+V
> >> do nějakého textového souboru a abych mohl prohledávat pdf (find) i v
> >> češtině.
> >> Pravděpodobně to mé fonty neumí. Ukázka dokumentu následuje.
> >>
> >> Může mi někdo poradit?
> >>
> >> S díky předem,
> >>
> >> V. Vopravil
> >>
> >> %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
> >>
> >> \documentclass[a4paper,12pt]{article}
> >> \usepackage[czech]{babel}
> >> \usepackage[cp1250]{inputenc}
> >> \usepackage[T1]{fontenc}
> >> \usepackage{lmodern}
> >> \begin{document}
> >> Test psaní:  Příšerně žluťoučký kůň úpěl ďábelské ódy.
> >>
> >>   PŘÍŠERNĚ ŽLUŤOUČKÝ KŮŇ ÚPĚL ĎÁBELSKÉ ÓDY.
> >> \end{document}
> >>
> >> %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
> >>
> >>
> >> _______________________________________________
> >> csTeX mailing list
> >> csTeX at cs.felk.cvut.cz
> >> https://lists.felk.cvut.cz/mailman/listinfo/cstex
> >
> > _______________________________________________
> > csTeX mailing list
> > csTeX at cs.felk.cvut.cz
> > https://lists.felk.cvut.cz/mailman/listinfo/cstex
> >
>
>
>
> --
> Michal Růžička <xruzick7 at fi.muni.cz>
> OpenPGP key: https://www.fi.muni.cz/~xruzick7/pgp-klic/
> Fingerprint: 489C 5EC8 0FD6 2BE8 9E59  B4F7 19C1 3E8C E0F5 DB61
> _______________________________________________
> csTeX mailing list
> csTeX at cs.felk.cvut.cz
> https://lists.felk.cvut.cz/mailman/listinfo/cstex
>
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://lists.felk.cvut.cz/pipermail/cstex/attachments/20171211/468e6283/attachment.html>


More information about the csTeX mailing list