import TeX

Petr Olsak olsak at math.feld.cvut.cz
Fri Oct 6 08:58:58 CET 1995


Dobry den,

On Thu, 5 Oct 1995, Borivoj Tydlitat wrote:

> 1) Moji pratele, kteri vydavaji knizky, by radi publikovali nejake
> odborne teologicke texty (proto ta rectina), ktere jsou napsane v
> TeXu. Problem je v tom, ze oni TeX neumi a nejsou na redakci TeXovych
> dat zavedeni. Proto by kvuli korekturam atd. radi konvertovali texty
> do nejakeho formatu, ktery umeji zvladnout, nejradeji zmineneho
> WordPerfectu. Pritom je pro ne dulezite spravne konvertovat ruzne
> exoticke symboly, ale nejde tu tolik o celkove formatovani nebo napr.
> vzorce.

Na to je tezka odpoved. Zdrojove texty TeXu jsou psany v jazyku, ktery je
velmi pruzne prizpusobitelny podminkam a problemum daneho textu. Toto
prizpusobeni se realizuje pomoci souboru definic maker TeXu a TeX jej
interpretuje svou vstupni casti, ktere se rika expand procesor. Definice
v TeXu jsou bohatym a pro mnohe velmi slozitym programovacim jazykem.
Presne je popsan v [Knuth: The TeXbook]. Napriklad Vas problem s reckymi
texty je v puvodnich TeXovskych zdrojich jiste resen nejakou specialni
podporou pomoci maker TeXu pro tento jazyk a pripadne specialnimi fonty.

Pokud by mel existovat nejaky konvertor, pak by musel umet nacist veskere
vstupni texty (tj. vcetne souboru maker) ve stejne podobe jako TeX a
pripadne i dulezite informace z pouzitych fontovych metrik. Temto
informacim by konvertor musel rozumet naprosto stenym zpusobem, jak jim
rozumi TeX. Ve svem dusledku to znamena, ze by zhruba polovina kodu TeXu
musela byt integrovana i do konvertoru (napriklad urcite cely expand
procesor). O takovem konvertoru mi opravdu neni nic znamo, i kdyz je
principialne snadneji vytvoritelny, nez by se na prvni pohled mohlo zdat.
Cely TeX je totiz napsan ve verejne pristupnem zdrojovem kodu WEB, ktery
umoznuje vykuchat do ciloveho programu relativne prehledne serazene ty
casti algoritmu, ktere programator pri programovani konvertoru potrebuje.

>
> 2) Jini moji pratele maji zase problem s redakci textu tluste knihy,
> kterou nasnimali pomoci OCR a radi by se pokusili o nejakou
> automatickou nebo poloautomatickou rekonstrukci. Jednim z moznych
> cilu zde by byla i rekonstrukce casti formatove informace. V teto
> souvislosti jsem se zacal zajimat o syntax ruznych textovych formatu.
> Odtud muj dotaz po formatu (tim myslim syntaxi) TeXoveho zdrojoveho
> textu.

Jak bylo receno vyse, syntaxe vstupniho jazyka TeXu je zavisla na pouzitem
baliku maker. Na primitivni urovni (tj. v okamziku, kdy TeX jeste
neprecetl zadna makra) je jazyk definovan ve zminene knize [The TeXbook].
Ovsem na teto urovni nikdo vstupni texty nepripravuje a vzdy se opre o
nejaka makra. Napriklad v teto diskusi jiz zminena sekvence \alpha pro
znak alfa neni interpretovana jadrem TeXu samotneho, ale je definovana v
makrech pro TeX a interpretuje ji expand procesor. V knize [The TeXbook]
je take popsano zakladni makro k TeXu s nazvem plain. Dalsi doporucena
literatura pro zvladnuti porizovani textu a vkladani jednoduchych
formatovacich informaci s vyuzitim jiz vytvorenych maker vede napriklad k
LaTeXu jako jednomu z velmi casto pouzivanych maker TeXu zvlaste v
akademickem svete. V diskusi jiz byl zminen [LaTeX pro zacatecniky].
Podrobneji je LaTeX popsan v [Lamort:LaTeX]. Ani LaTeX nema definitivni
syntaxi, protoze nad makrem LaTeXu se vesmes vzdy pred nactenim vlastniho
dokumentu nacitaji dalsi makra.

> Borivoj Tydlitat

Petr Olsak





More information about the csTeX mailing list