<div dir="ltr"><div>Dobrý den,<br><br></div>na vstupním kódování nezáleží, to není v hotovém PDF nikde viditelné, ale kromě správného mapování balíčkem cmap záleží ještě na prohlížeči PDF. Přestože toUnicode i ActualText jsou dokumentované vlastnosti, nejsou implementovány ve všech prohlížečích.<br></div><div class="gmail_extra"><br clear="all"><div><div class="gmail_signature" data-smartmail="gmail_signature">Zdeněk Wagner<br><a href="http://ttsm.icpf.cas.cz/team/wagner.shtml" target="_blank">http://ttsm.icpf.cas.cz/team/wagner.shtml</a><br><a href="http://icebearsoft.euweb.cz" target="_blank">http://icebearsoft.euweb.cz</a></div></div>
<br><div class="gmail_quote">Dne 11. prosince 2017 10:02 Michal Růžička <span dir="ltr"><<a href="mailto:xruzick7@fi.muni.cz" target="_blank">xruzick7@fi.muni.cz</a>></span> napsal(a):<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Podstatné je v PDF nechat vyznačit mapování glyfů na unicode znaky. Je<br>
možné k tomu využít LaTeXový balíček „cmap“. Pro překlad pdflatexem mám<br>
osvědčenou hlavičku:<br>
<br>
> % Začátek preambule.<br>
> \documentclass{article} % Mezi nejdůležitější třídy dokumentů patří article,<br>
>                         % book a report. Třída dokumentů určuje např. to, že<br>
>                         % článek (article) nemá (na rozdíl od knihy) příkazy pro<br>
>                         % sazbu kapitol apod.<br>
> \usepackage[resetfonts]{cmap} % Při překladu pdfTeXem do PDF zajistí správné<br>
>                               % mapování znaků na Unicode sekvence a učiní tak<br>
>                               % text prohledávatelný a kopírovatelný do schránky.<br>
> \usepackage{lmodern} % Sázet se bude Latin Modern fonty, nikoli výchozími<br>
>                      % EC fonty.<br>
> \usepackage[czech]{babel} % Nastavení použití českého prostředí pro LaTeX.<br>
>                           % Dokument přeložíme příkazem 'latex <název souboru>'<br>
>                           % či 'pdflatex <název souboru>'.<br>
> \usepackage[latin2]{inputenc} % Informace o tom, že tento zdrojový text je<br>
>                               % uložen v kódování ISO 8859-2 (někdy označovaném<br>
>                               % jako ISO Latin 2).<br>
> \usepackage[T1]{fontenc} % Nastavení kódování fontu na formát T1.<br>
> % Konec preambule.<br>
><br>
> % Začátek dokumentu.<br>
> \begin{document}<br>
<br>
Pro „inputenc“ je samozřejmě potřeba nastavit kódování, ve kterém je<br>
zdrojový text skutečně uložen.<br>
<br>
--mr<br>
<br>
<br>
Dne 11.12.2017 v 8:35 Luboš Kloc napsal(a):<br>
<div class="HOEnZb"><div class="h5">> Dobrý den,<br>
><br>
> ono hlavně záleží na tom, jak má být čeština kódována v tom textovém<br>
> souboru. Používáte font kódovaný v T1 a to asi mimo TeXové prostředí<br>
> opravdu nebude fungovat.<br>
><br>
> Podle ukázky soudím, že pro textové soubory používáte kódování cp1250,<br>
> což už je dnes hodně zastaralé (neznám Windows, ale snad už dnes<br>
> systémově používají nějakou verzi utf). Nevím, zda existuje TeXový font<br>
> kódovaný v cp1250, přibližně by tomu mohly odpovídat cs fonty v OT1, ale<br>
> opravdu jen přibližně.<br>
><br>
> Pokud netrváte na TeXových fontech, pak by asi bylo nejschůdnější použít<br>
> XeLaTeX s nějakým systémovým fontem.<br>
><br>
> S pozdravem,<br>
><br>
> Luboš Kloc<br>
><br>
><br>
><br>
> Dne 10.12.2017 v 16:21 Vaclav Vopravil napsal(a):<br>
>> Dobrý den,<br>
>><br>
>> používám LaTeX, kompiluji latex --> dvips --> ps2pdf, na čtení<br>
>> výsledného souboru pdf používám Foxit Reader.<br>
>> Potřeboval bych, abych ve výsledném souboru mohl použít CTRL+C a CTRL+V<br>
>> do nějakého textového souboru a abych mohl prohledávat pdf (find) i v<br>
>> češtině.<br>
>> Pravděpodobně to mé fonty neumí. Ukázka dokumentu následuje.<br>
>><br>
>> Může mi někdo poradit?<br>
>><br>
>> S díky předem,<br>
>><br>
>> V. Vopravil<br>
>><br>
>> %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%<wbr>%%%%%%%%%%%%%%%%%%%%<br>
>><br>
>> \documentclass[a4paper,12pt]{<wbr>article}<br>
>> \usepackage[czech]{babel}<br>
>> \usepackage[cp1250]{inputenc}<br>
>> \usepackage[T1]{fontenc}<br>
>> \usepackage{lmodern}<br>
>> \begin{document}<br>
>> Test psaní:  Příšerně žluťoučký kůň úpěl ďábelské ódy.<br>
>><br>
>>   PŘÍŠERNĚ ŽLUŤOUČKÝ KŮŇ ÚPĚL ĎÁBELSKÉ ÓDY.<br>
>> \end{document}<br>
>><br>
>> %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%<wbr>%%%%%%%%%%%%%%%%%%%%<br>
>><br>
>><br>
>> ______________________________<wbr>_________________<br>
>> csTeX mailing list<br>
>> <a href="mailto:csTeX@cs.felk.cvut.cz">csTeX@cs.felk.cvut.cz</a><br>
>> <a href="https://lists.felk.cvut.cz/mailman/listinfo/cstex" rel="noreferrer" target="_blank">https://lists.felk.cvut.cz/<wbr>mailman/listinfo/cstex</a><br>
><br>
> ______________________________<wbr>_________________<br>
> csTeX mailing list<br>
> <a href="mailto:csTeX@cs.felk.cvut.cz">csTeX@cs.felk.cvut.cz</a><br>
> <a href="https://lists.felk.cvut.cz/mailman/listinfo/cstex" rel="noreferrer" target="_blank">https://lists.felk.cvut.cz/<wbr>mailman/listinfo/cstex</a><br>
><br>
<br>
<br>
<br>
</div></div><span class="HOEnZb"><font color="#888888">--<br>
Michal Růžička <<a href="mailto:xruzick7@fi.muni.cz">xruzick7@fi.muni.cz</a>><br>
OpenPGP key: <a href="https://www.fi.muni.cz/~xruzick7/pgp-klic/" rel="noreferrer" target="_blank">https://www.fi.muni.cz/~<wbr>xruzick7/pgp-klic/</a><br>
Fingerprint: 489C 5EC8 0FD6 2BE8 9E59  B4F7 19C1 3E8C E0F5 DB61<br>
</font></span><div class="HOEnZb"><div class="h5">______________________________<wbr>_________________<br>
csTeX mailing list<br>
<a href="mailto:csTeX@cs.felk.cvut.cz">csTeX@cs.felk.cvut.cz</a><br>
<a href="https://lists.felk.cvut.cz/mailman/listinfo/cstex" rel="noreferrer" target="_blank">https://lists.felk.cvut.cz/<wbr>mailman/listinfo/cstex</a><br>
</div></div></blockquote></div><br></div>