[cstex] (Lehce OT?) Formátování (La)TeXem do textového souboru?
Michal Růžička
xruzick7 at fi.muni.cz
Tue Jan 19 14:50:35 CET 2010
Nevím, jestli projde příloha. Pokud ano, v přikládám ZIP archiv s ukázkou.
Pokud ne, tak zdroják „babel.tex“ vypadá takto (byl kódován v ISO-8859-2):
---8<--------------------------------------------------------------
\documentclass{article}
\usepackage{lmodern}
\usepackage[czech]{babel}
\usepackage[latin2]{inputenc}
\usepackage{cmap}
\usepackage[T1]{fontenc}
\begin{document}
Ahoj světe!
V~této větě byla použita nezlomitelná mezera~-- do
zdrojového textu se vkládá jako znak tilda (\char`\~).
K~práci s~nezlomitelnými mezerami slouží program Vlna.
Nový odstavec se vytvoří vynecháním řádku.
Text vložíme do \uv{uvozovek} příkazem "`\verb|\uv|"',
případně dvojicí "`\verb|"`|"' a~"`\verb|"'|"'. Vložení
spojovníku se správným českým chováním bez uvádění
globálního nastavení
"`\verb|\languageattribute{czech}{split}|"' či užití příkazů
"`\verb|\splithyphens|"' a~"`\verb|\standardhyphens|"'
dosáhneme vložením "`\verb|"=|"'.
\[\left|\sum_{i=0}^{n-1} f(t_i) (x_{i+1}-x_i) - s\right|
< \varepsilon\]
Šíleně žluťoučký kůň úpěl ďábelské ódy.
\end{document}
---8<--------------------------------------------------------------
Přeložil jsem jedním průchodem „pdflatex babel.tex“. Výsledek práce
„pdftotext -enc UTF-8 -layout -nopgbrk babel.pdf“ pak vypadá takto:
---8<--------------------------------------------------------------
Ahoj světe!
V této větě byla použita nezlomitelná mezera – do zdrojového textu
se vkládá
jako znak tilda (~). K práci s nezlomitelnými mezerami slouží program Vlna.
Nový odstavec se vytvoří vynecháním řádku.
Text vložíme do „uvozovek“ příkazem „\uv“, případně dvojicí „"‘“ a „"’“.
Vložení spojovníku se správným českým chováním bez uvádění globálního
nasta-
vení „\languageattribute{czech}{split}“ či užití příkazů „\splithyphens“
a „\standardhyphens“ dosáhneme vložením „"=“.
⃒ 𝑛−1 ⃒
⃒ ∑︁ ⃒
𝑓 (𝑡 𝑖 )(𝑥 𝑖+1 − 𝑥 𝑖 ) − 𝑠⃒ < 𝜀
⃒ ⃒
⃒
⃒ ⃒
𝑖=0
Šíleně žluťoučký kůň úpěl ďábelské ódy.
1
---8<--------------------------------------------------------------
Použil jsem aktuální TeX Live 2009 (průběžný update z internetového
repositáře) na GNU/Linuxu.
S pozdravem
Michal Růžička
Dne 19.1.2010 14:24, Zdenek Wagner napsal(a):
> Dne 19. ledna 2010 14:01 Procházka Lukáš Ing. - Pontex s. r. o.
> <LPr at pontex.cz> napsal(a):
>> ... Zkusil jsem to, ale výsledek není moc uspokojivý.
>>
>> Např. písmena s háčky a čárkami jsou vždy o řádek výše, než háčky a čárky.
>>
> Jaké používáte fonty? vím, že to mohou dělat CS-fonty, LM-fonty by asi
> měly být OK.
>
>> Zde ukázka překladu:
>>
>> ----
>>
>> Kapitola 2
>>
>> r y c u ?ch
>> Pˇehled v´poˇt? podle mezn´
>>
>>
>>
>> o.
>> u
>> stav?
>>
>> 2.1 Termonologie
>> r.
>> s.
>> e e y y ?ˇ ?:
>> Typy ? a odvozen´ typy promˇnn´ch (charakteristick´ch) zat´zen´
>> x
>>
>> * ?0 × Qk = kombinaˇn´ hodnota promˇnn´ho (charakteristick´ho) zat´zen´
>> c ? e e e ?ˇ ?,
>> te
>>
>> * ?1 × Qk = ˇast´ hodnota promˇnn´ho (charakteristick´ho) zat´zen´
>> c a e e e ?ˇ ?,
>>
>> * ?2 × Qk = kvazist´l´ hodnota promˇnn´ho (charakteristick´ho) zat´zen´
>> aa e e e ?ˇ ?.
>> n
>>
>>
>>
>> 2.2 y c ?ho ´ ´
>> V´poˇty podle mezn´ stavu unosnosti (1. MS, MSU)
>> Po
>>
>>
>>
>>
>> (= ULS", Ultimate Limit State")
>> " "
>> s ? c r ? ´
>> Roxliˇuj´ se ˇtyˇi mezn´ stavy unosnosti:
>>
>> * a e a ? ca
>> EQU" - ztr´ta statick´ rovnov´ny konstrukce nebo jej´ ˇ´sti,
>> "
>> * STR" - porucha nebo nadmˇrn´ deformace konstrukce nebo jej´ ˇ´sti, kde
>> rozho-
>> e a ? ca
>> "
>> a r? a ? uˇ u,
>> duje pevnost materi´lu; sem patˇ´ posuzov´n´ pr?rez?
>>
>> * e a
>> GEO" - porucha nebo nadmˇrn´ deformace zaloˇen´ z ?,
>> "
>> * FAT" - unavov´ unosnost.
>> ´ a´
>> "
>> ´ ? r a e
>> MSU se vyhodnocuj´ pro tˇi n´vrhov´ situace. Pro kaˇdou z n´vrhov´ch
>> situac´ je d´n
>> z a y
>> ? a
>> s y a ?:
>> (trochu odliˇn´) z´pis kombinac´
>>
>> * trval´ a doˇasn´ n´vrhov´ situace ( Per")
>> e c e a e
>> "
>> e
>> Obecnˇ:
>>
>> (?G,j × Gk,j ) + ?P × P + ?Q,1 × Qk,1 + (?Q,i ×
>> ?0,i × Qk,i ) (2.1)
>> j i>1
>>
>> ? y c a aa ?ˇ ?, y c e r e ?, uc e
>> s? y c e
>> Tj. kombinuj´ se v´poˇtov´ st´l´ zat´zen´ v´poˇtov´ pˇedpˇt´
>> nej´ˇinnˇjˇ´ v´poˇtov´
>> e e ?ˇ ? ? c ? y c a e a ?ˇ
>> ?.
>> promˇnn´ zat´zen´ a ostatn´ kombinaˇn´ v´poˇtov´ promˇnn´ zat´zen´
>>
>>
>> 4
>>
>> ----
>>
>> NB: Jaké kódování pro Windows? Také UTF-8?
>>
>> Pokud byste měl nějaké pdf, které se vám zdárně podařilo "vyexportovat" do
>> txt, rád se podívám (pro představu o složitosti).
>>
>> Já sám jsem teď postup aplikoval na složitější dokument (se kterým teď
>> pracuji), jen jako pro primární test, ale ten obsahuje i matematické vzorce,
>> stránky na šířku a obrázky; ty v txt samozřejmě nebudou.
>>
>> Primární dotaz byl pro konverzi texťáku (byť s nějakým primitivním
>> značkováním) do texťáku; aby procesor dopsal hlavičky, očísloval stránky
>> apod.
>>
>> Zdravím
>>
>> Lukáš Procházka
>>
>>
>> On Tue, 19 Jan 2010 11:14:41 +0100, Michal Růžička <xruzick7 at fi.muni.cz>
>> wrote:
>>
>>> Zdravím,
>>>
>>> pro vytvoření opravdu hezkého výstupu asi neporadím, ale puštění
>>>
>>> pdftotext -enc UTF-8 -layout -nopgbrk
>>>
>>> na PDF vytvořené pdftexem (s balíkem CMAP, aby byly dostupné správné
>>> znaky) by nepostačilo?
>>>
>>> S pozdravem
>>> Michal Růžička
>>>
>>>
>>> Dne 19.1.2010 8:45, Procházka Lukáš Ing. - Pontex s. r. o. napsal(a):
>>>>
>>>> Zdravím v konferenci,
>>>>
>>>> chtěl bych se zeptat, jestli někdo náhodou neřešil výstup z (LaTeXu) do
>>>> "hezkého ASCII výstupu".
>>>>
>>>> Co tím myslím - viz stránka:
>>>> http://www.ietf.org/rfc/rfc0822.txt?number=822
>>>>
>>>> Zkrátka jde mi o nějaký procesor - (La)TeX, který načítá svůj zdroják,
>>>> nebo NĚJAKÝ JINÝ program, který čte nějaký textový soubor (nebo třeba
>>>> stdin) - a výsledek zapisuje do "ASCII souboru"; aby ten procesor
>>>> generoval textový výstup s "nějakou štábní kulturou", např. (jak je
>>>> vidět v ukázce):
>>>>
>>>> - hlídá počet stránek, doplňuje hlavičku i patičku na stránku,
>>>> - stránka má nějaký (maximální) počet řádků, na její konec se možná
>>>> umísťuje znak konce stránky (pro tisk),
>>>> - používá určitá pravidla pro sazbu (víceúrovňových) nadpisů,
>>>> - zarovnáná do bloku (tj. doplňuje mezery uvnitř řádku);
>>>>
>>>> - nemusí umět zápis matematických vzorců.
>>>>
>>>> Párkrát jsem narazil na potřebu takového procesoru - když jsem chtěl
>>>> napsat nějaký krátký manuál a zároveň jsem chtěl, aby výsledkem byl
>>>> textový ("ASCII") soubor (tj. ne .dvi, .ps nebo .pdf) s "NĚJAKÝM PĚKNÝM"
>>>> formátováním; to jsem si ale musel zajistit sám.
>>>>
>>>> Uvedená stránka vypadá na to být generovaná autmaticky - čím?
>>>>
>>>> Zdravím
>>>>
>>>> Lukáš Procházka
--
Michal Růžička <xruzick7 at fi.muni.cz>
https://www.fi.muni.cz/~xruzick7/pgp-klic/
PGP key fingerprint: 1CB2 41B9 F029 4B47 EECD 9BDA 90C9 CEB0 524C DACB
-------------- next part --------------
A non-text attachment was scrubbed...
Name: pdftotexttest.zip
Type: application/zip
Size: 99183 bytes
Desc: not available
URL: <http://lists.felk.cvut.cz/pipermail/cstex/attachments/20100119/8bf8d756/attachment-0003.zip>
More information about the csTeX
mailing list