[cstex] plain-pdfTeX a záložky v Unicode

T.K. motarecuk at seznam.cz
Thu Feb 14 12:27:05 CET 2013


Děkuji za odpověď.
Také si nejsem úplně jist, jaký přesně zápis Unicodu pdf používá. Před
lety jsem si přečetl, že lze použít přímý zápis ve formátu utf-16 Big
Endian, kde je ale každý „bajt“ zapsán oktalově a uveden zpětným
lomítkem. Na začátku řetězce musí pak být ve stejné formě i BOM. To
fungovalo a v této formě jsem řetězce našel i v hotovém pdf souboru po
jeho otevření texťákem. Teď jsem se k tomu po čase vrátil, funguje to i
nadále, ale po otevření pdf texťákem je to v nějakém jiném formátu.
Nezkoumal jsem, je-li to jinou verzí pdf, vývojem v pdfTeXu, nebo
dokonce jen tím texťákem.
Mám svoje makro, které funguje v zásadě tak, jak jste navrhoval, a navíc
udělá převod na to oktalové utf-16 BE. Má ale ještě nějaké otravné
mouchy (týkají se spíš pohodlnosti použití než funkce), které teď nemám
moc času chytat, proto jsem se ptal na hotové řešení. Jestliže tedy
hotové řešení není, zeptám se ještě na jednu věc: Myslíte, že v době
luaTeXu a XeTeXu má cenu takové makro nabídnout k všeobecnému použití?
Jen abych věděl, zda mám příležitostně těch pár much vychytat, nebo si
ho nechat jen pro sebe i s nimi.

Zdraví
Tomáš Kučera





Dne 11.2.2013 22:05, Zdenek Wagner napsal(a):
> Dne 11. února 2013 17:44 T.K. <motarecuk at seznam.cz> napsal(a):
>> Dobrý den,
>>            zajímalo by mě, zda je někde dostupné nějaké makro použitelné
>> v pdfTeXu s plainem, které by umělo vytvářet texty např. záložek či
>> metadat v pdfinfo v Unicode.
>> cnv od pana Olšáka znám, mám ale na mysli něco, co by nezáviselo na
>> konverzních tabulkách, ale co by umělo přímo převést vstup v utf8 na
>> výstup v "pdf-Unicode" (nebo jak ten výstupní formát nazvat).
>> Znáte něco takového?
>>
> Pokud víte, že vstup je v UTF-8, a používáte encTeX a text pro záložky
> a metadata není použit jinde (tj. nebere se z nadpisu kapitoly), pak
> můžete dočasně nastavit \mubytein=0, nastavit \catcode tak, aby
> všechny bajty byly povoleny, zavolat odpovídající primitiv a zase vše
> vrátit do původního stavu. Nejsem si však jist, jestli se používá
> UTF-8, možná se v PDF používá UTF-16. Pokud byste použil XeTeX nebo
> luaTeX, bylo by to jednodušší, protože oba pracují interně v unicode,
> 
>> Předem díky
>> Tomáš Kučera
>> _______________________________________________
>> csTeX mailing list
>> csTeX at cs.felk.cvut.cz
>> http://lists.felk.cvut.cz/mailman/listinfo/cstex
> 
> 
> 



More information about the csTeX mailing list