[cstex] plain-pdfTeX a záložky v Unicode

Zdenek Wagner zdenek.wagner at gmail.com
Thu Feb 14 13:10:42 CET 2013


Dne 14. února 2013 12:27 T.K. <motarecuk at seznam.cz> napsal(a):
> Děkuji za odpověď.
> Také si nejsem úplně jist, jaký přesně zápis Unicodu pdf používá. Před
> lety jsem si přečetl, že lze použít přímý zápis ve formátu utf-16 Big
> Endian, kde je ale každý "bajt" zapsán oktalově a uveden zpětným
> lomítkem. Na začátku řetězce musí pak být ve stejné formě i BOM. To
> fungovalo a v této formě jsem řetězce našel i v hotovém pdf souboru po
> jeho otevření texťákem. Teď jsem se k tomu po čase vrátil, funguje to i
> nadále, ale po otevření pdf texťákem je to v nějakém jiném formátu.
> Nezkoumal jsem, je-li to jinou verzí pdf, vývojem v pdfTeXu, nebo
> dokonce jen tím texťákem.
> Mám svoje makro, které funguje v zásadě tak, jak jste navrhoval, a navíc
> udělá převod na to oktalové utf-16 BE. Má ale ještě nějaké otravné
> mouchy (týkají se spíš pohodlnosti použití než funkce), které teď nemám
> moc času chytat, proto jsem se ptal na hotové řešení. Jestliže tedy
> hotové řešení není, zeptám se ještě na jednu věc: Myslíte, že v době
> luaTeXu a XeTeXu má cenu takové makro nabídnout k všeobecnému použití?
> Jen abych věděl, zda mám příležitostně těch pár much vychytat, nebo si
> ho nechat jen pro sebe i s nimi.
>
Těžko říci, já používám LaTeX a hyperref to umí i v pdflatexu bez Xe a
bez lua. Nechtělo se mi zkoumat, jak to funguje uvnitř, protože
hyperref je mamut. Měl by se vyjádřit nějaký uživatel plainu.

> Zdraví
> Tomáš Kučera
>
>
>
>
>
> Dne 11.2.2013 22:05, Zdenek Wagner napsal(a):
>> Dne 11. února 2013 17:44 T.K. <motarecuk at seznam.cz> napsal(a):
>>> Dobrý den,
>>>            zajímalo by mě, zda je někde dostupné nějaké makro použitelné
>>> v pdfTeXu s plainem, které by umělo vytvářet texty např. záložek či
>>> metadat v pdfinfo v Unicode.
>>> cnv od pana Olšáka znám, mám ale na mysli něco, co by nezáviselo na
>>> konverzních tabulkách, ale co by umělo přímo převést vstup v utf8 na
>>> výstup v "pdf-Unicode" (nebo jak ten výstupní formát nazvat).
>>> Znáte něco takového?
>>>
>> Pokud víte, že vstup je v UTF-8, a používáte encTeX a text pro záložky
>> a metadata není použit jinde (tj. nebere se z nadpisu kapitoly), pak
>> můžete dočasně nastavit \mubytein=0, nastavit \catcode tak, aby
>> všechny bajty byly povoleny, zavolat odpovídající primitiv a zase vše
>> vrátit do původního stavu. Nejsem si však jist, jestli se používá
>> UTF-8, možná se v PDF používá UTF-16. Pokud byste použil XeTeX nebo
>> luaTeX, bylo by to jednodušší, protože oba pracují interně v unicode,
>>
>>> Předem díky
>>> Tomáš Kučera
>>> _______________________________________________
>>> csTeX mailing list
>>> csTeX at cs.felk.cvut.cz
>>> http://lists.felk.cvut.cz/mailman/listinfo/cstex
>>
>>
>>
> _______________________________________________
> csTeX mailing list
> csTeX at cs.felk.cvut.cz
> http://lists.felk.cvut.cz/mailman/listinfo/cstex



-- 
Zdeněk Wagner
http://hroch486.icpf.cas.cz/wagner/
http://icebearsoft.euweb.cz




More information about the csTeX mailing list