[cstex] (Lehce OT?) Formátování (La)TeXem do textového souboru?

Tue Jan 19 14:50:35 CET 2010

Nevím, jestli projde příloha. Pokud ano, v přikládám ZIP archiv s ukázkou.

Pokud ne, tak zdroják „babel.tex“ vypadá takto (byl kódován v ISO-8859-2):

---8<--------------------------------------------------------------
\documentclass{article}
\usepackage{lmodern}
\usepackage[czech]{babel}
\usepackage[latin2]{inputenc}
\usepackage{cmap}
\usepackage[T1]{fontenc}

\begin{document}
Ahoj světe!

V~této větě byla použita nezlomitelná mezera~-- do
zdrojového textu se vkládá jako znak tilda (\char`\~).
K~práci s~nezlomitelnými mezerami slouží program Vlna.

Nový odstavec se vytvoří vynecháním řádku.

Text vložíme do \uv{uvozovek} příkazem "`\verb|\uv|"',
případně dvojicí "`\verb|"`|"' a~"`\verb|"'|"'. Vložení
spojovníku se správným českým chováním bez uvádění
globálního nastavení
"`\verb|\languageattribute{czech}{split}|"' či užití příkazů
"`\verb|\splithyphens|"' a~"`\verb|\standardhyphens|"'
dosáhneme vložením "`\verb|"=|"'.

\[\left|\sum_{i=0}^{n-1} f(t_i) (x_{i+1}-x_i) - s\right|
< \varepsilon\]

Šíleně žluťoučký kůň úpěl ďábelské ódy.
\end{document}
---8<--------------------------------------------------------------

Přeložil jsem jedním průchodem „pdflatex babel.tex“. Výsledek práce
„pdftotext -enc UTF-8 -layout -nopgbrk babel.pdf“ pak vypadá takto:

---8<--------------------------------------------------------------
   Ahoj světe!
   V této větě byla použita nezlomitelná mezera – do zdrojového textu
se vkládá
jako znak tilda (~). K práci s nezlomitelnými mezerami slouží program Vlna.
   Nový odstavec se vytvoří vynecháním řádku.
   Text vložíme do „uvozovek“ příkazem „\uv“, případně dvojicí „"‘“ a „"’“.
Vložení spojovníku se správným českým chováním bez uvádění globálního
nasta-
vení „\languageattribute{czech}{split}“ či užití příkazů „\splithyphens“
a „\standardhyphens“ dosáhneme vložením „"=“.
                         ⃒ 𝑛−1                           ⃒
                         ⃒ ∑︁                            ⃒
                               𝑓 (𝑡 𝑖 )(𝑥 𝑖+1 − 𝑥 𝑖 ) − 𝑠⃒ < 𝜀
                         ⃒                               ⃒
                         ⃒
                         ⃒                               ⃒
                          𝑖=0

   Šíleně žluťoučký kůň úpěl ďábelské ódy.

                                      1
---8<--------------------------------------------------------------

Použil jsem aktuální TeX Live 2009 (průběžný update z internetového
repositáře) na GNU/Linuxu.

S pozdravem
Michal Růžička

Dne 19.1.2010 14:24, Zdenek Wagner napsal(a):
> Dne 19. ledna 2010 14:01 Procházka Lukáš Ing. - Pontex s. r. o.
> <LPr at pontex.cz> napsal(a):
>> ... Zkusil jsem to, ale výsledek není moc uspokojivý.
>>
>> Např. písmena s háčky a čárkami jsou vždy o řádek výše, než háčky a čárky.
>>
> Jaké používáte fonty? vím, že to mohou dělat CS-fonty, LM-fonty by asi
> měly být OK.
> 
>> Zde ukázka překladu:
>>
>> ----
>>
>>  Kapitola 2
>>
>>   r      y c u            ?ch
>>  Pˇehled v´poˇt? podle mezn´
>>
>>
>>
>>                                            o.
>>     u
>>  stav?
>>
>>  2.1     Termonologie
>>                                    r.
>>                            s.
>>                 e          e y                    y       ?ˇ ?:
>>  Typy ? a odvozen´ typy promˇnn´ch (charakteristick´ch) zat´zen´
>>             x
>>
>>    * ?0 × Qk = kombinaˇn´ hodnota promˇnn´ho (charakteristick´ho) zat´zen´
>>                       c ?             e e                    e       ?ˇ ?,
>>          te
>>
>>    * ?1 × Qk = ˇast´ hodnota promˇnn´ho (charakteristick´ho) zat´zen´
>>                c a               e e                    e       ?ˇ ?,
>>
>>    * ?2 × Qk = kvazist´l´ hodnota promˇnn´ho (charakteristick´ho) zat´zen´
>>                       aa              e e                    e       ?ˇ ?.
>>   n
>>
>>
>>
>>  2.2      y c              ?ho     ´                   ´
>>         V´poˇty podle mezn´ stavu unosnosti (1. MS, MSU)
>> Po
>>
>>
>>
>>
>>  (= ULS", Ultimate Limit State")
>>    "      "
>>        s ?     c r       ?       ´
>>   Roxliˇuj´ se ˇtyˇi mezn´ stavy unosnosti:
>>
>>    *             a         e        a                     ? ca
>>       EQU" - ztr´ta statick´ rovnov´ny konstrukce nebo jej´ ˇ´sti,
>>      "
>>    * STR" - porucha nebo nadmˇrn´ deformace konstrukce nebo jej´ ˇ´sti, kde
>> rozho-
>>                                  e a                               ? ca
>>      "
>>                        a           r?        a ? uˇ u,
>>     duje pevnost materi´lu; sem patˇ´ posuzov´n´ pr?rez?
>>
>>    *                               e a
>>        GEO" - porucha nebo nadmˇrn´ deformace zaloˇen´ z ?,
>>       "
>>     * FAT" - unavov´ unosnost.
>>                 ´      a´
>>       "
>>         ´               ?    r a      e
>>     MSU se vyhodnocuj´ pro tˇi n´vrhov´ situace. Pro kaˇdou z n´vrhov´ch
>> situac´ je d´n
>>                                                        z       a     y
>>   ?     a
>>             s y a              ?:
>>  (trochu odliˇn´) z´pis kombinac´
>>
>>    * trval´ a doˇasn´ n´vrhov´ situace ( Per")
>>           e     c   e a      e
>>                                         "
>>            e
>>      Obecnˇ:
>>
>>                    (?G,j × Gk,j ) + ?P × P + ?Q,1 × Qk,1 +         (?Q,i ×
>> ?0,i × Qk,i )   (2.1)
>>                j                                             i>1
>>
>>                    ?     y c a aa          ?ˇ ?, y c e r         e ?,  uc e
>> s? y c e
>>        Tj. kombinuj´ se v´poˇtov´ st´l´ zat´zen´ v´poˇtov´ pˇedpˇt´
>> nej´ˇinnˇjˇ´ v´poˇtov´
>>             e e      ?ˇ ?         ?          c ? y c a          e a     ?ˇ
>> ?.
>>        promˇnn´ zat´zen´ a ostatn´ kombinaˇn´ v´poˇtov´ promˇnn´ zat´zen´
>>
>>
>>                                               4
>>
>> ----
>>
>> NB: Jaké kódování pro Windows? Také UTF-8?
>>
>> Pokud byste měl nějaké pdf, které se vám zdárně podařilo "vyexportovat" do
>> txt, rád se podívám (pro představu o složitosti).
>>
>> Já sám jsem teď postup aplikoval na složitější dokument (se kterým teď
>> pracuji), jen jako pro primární test, ale ten obsahuje i matematické vzorce,
>> stránky na šířku a obrázky; ty v txt samozřejmě nebudou.
>>
>> Primární dotaz byl pro konverzi texťáku (byť s nějakým primitivním
>> značkováním) do texťáku; aby procesor dopsal hlavičky, očísloval stránky
>> apod.
>>
>> Zdravím
>>
>> Lukáš Procházka
>>
>>
>> On Tue, 19 Jan 2010 11:14:41 +0100, Michal Růžička <xruzick7 at fi.muni.cz>
>> wrote:
>>
>>> Zdravím,
>>>
>>> pro vytvoření opravdu hezkého výstupu asi neporadím, ale puštění
>>>
>>> pdftotext -enc UTF-8 -layout -nopgbrk
>>>
>>> na PDF vytvořené pdftexem (s balíkem CMAP, aby byly dostupné správné
>>> znaky) by nepostačilo?
>>>
>>> S pozdravem
>>> Michal Růžička
>>>
>>>
>>> Dne 19.1.2010 8:45, Procházka Lukáš Ing. - Pontex s. r. o. napsal(a):
>>>>
>>>> Zdravím v konferenci,
>>>>
>>>> chtěl bych se zeptat, jestli někdo náhodou neřešil výstup z (LaTeXu) do
>>>> "hezkého ASCII výstupu".
>>>>
>>>> Co tím myslím - viz stránka:
>>>> http://www.ietf.org/rfc/rfc0822.txt?number=822
>>>>
>>>> Zkrátka jde mi o nějaký procesor - (La)TeX, který načítá svůj zdroják,
>>>> nebo NĚJAKÝ JINÝ program, který čte nějaký textový soubor (nebo třeba
>>>> stdin) - a výsledek zapisuje do "ASCII souboru"; aby ten procesor
>>>> generoval textový výstup s "nějakou štábní kulturou", např. (jak je
>>>> vidět v ukázce):
>>>>
>>>> -    hlídá počet stránek, doplňuje hlavičku i patičku na stránku,
>>>> -    stránka má nějaký (maximální) počet řádků, na její konec se možná
>>>> umísťuje znak konce stránky (pro tisk),
>>>> -    používá určitá pravidla pro sazbu (víceúrovňových) nadpisů,
>>>> -    zarovnáná do bloku (tj. doplňuje mezery uvnitř řádku);
>>>>
>>>> -    nemusí umět zápis matematických vzorců.
>>>>
>>>> Párkrát jsem narazil na potřebu takového procesoru - když jsem chtěl
>>>> napsat nějaký krátký manuál a zároveň jsem chtěl, aby výsledkem byl
>>>> textový ("ASCII") soubor (tj. ne .dvi, .ps nebo .pdf) s "NĚJAKÝM PĚKNÝM"
>>>> formátováním; to jsem si ale musel zajistit sám.
>>>>
>>>> Uvedená stránka vypadá na to být generovaná autmaticky - čím?
>>>>
>>>> Zdravím
>>>>
>>>> Lukáš Procházka

-- 
Michal Růžička <xruzick7 at fi.muni.cz>
https://www.fi.muni.cz/~xruzick7/pgp-klic/
PGP key fingerprint: 1CB2 41B9 F029 4B47 EECD  9BDA 90C9 CEB0 524C DACB
-------------- next part --------------
A non-text attachment was scrubbed...
Name: pdftotexttest.zip
Type: application/zip
Size: 99183 bytes
Desc: not available
URL: <http://lists.felk.cvut.cz/pipermail/cstex/attachments/20100119/8bf8d756/attachment-0003.zip>