Konverze plainTeX na html

Zdenek Wagner wagner at cesnet.cz
Mon Mar 8 11:51:27 CET 2004


On Mon, 8 Mar 2004, Petr Olsak wrote:

> Dovolim si zde uvest jinou cestu, ktera se mi zdala docela schudna.
> Zvlaste tehdy, pokud dokument neobsahuje zadnou matematiku.
> Me se osvedcilo zachovat primarni informace v TeXovem zdrojaku,
> protoze se to docela prijemne prohlizi a modifikuje obycejnym textovym
> editorem. Kdyz jsem dostal od zakaznika pozadavek na vystup v XML,

XML se take prohlizi a modifikuje obycejnym textovym editorem. Sice
existuji specialni editory na XML, ale mne naprosto vyhovuje EPM v OS/2
nebo vim v linuxu.

> podival jsem se na pozadovane DTD, napsal podle toho za pul hodinky
> kratka makra a pouzil jsem pro konverzi samotny TeX. Tato cesta se
> ukazala podstatne snadnejsi, nez jsem si puvodne myslel.
>
> Kazdy rozumny plainista ma v dokumentu oddelenu oblast maker od
> oblasti dobre strukturovaneho a znackovaneho dokumentu (trebaze
> sveraznym zpusobem). Ja osobne mam tyto dve veci v jednom souboru.
> Mezi oblast maker a oblast vlastniho textu dokumentu jsem pridal:
>
To je prave klicovy problem. Vsechny plainovske soubory nejsou dobre
strukturovane znackovane (pro LaTeXove dokumenty plati totez).

>
> Svym prispevkem jsem chtel ukazat, ze lze primarni informaci
> o dokumentu udrzet v plainTeXovem zdrojaku, zvlaste pokud se jedna
> o dobre znackovany dokument napr. o pocitacich bez matematickych
> vzorecku.
>
> Pripoustim, ze pokud by dokument obsahoval matematiku, byla by
> konverze obtizna. Vystup do MathML by snad byl mozny za pouziti Omegy
> (pry neco takoveho umi) nebo modifikaci TeXu tak, aby se
> vyuzila konverze na urovni math-listu, ktery je nejvice podobny
> pozadovanemu MathML. Zatim jsem tyto experimenty nedelal a zajimalo by
> me, jak konverzi dokumentu z TeXu s matematikou do HTML / XML
> resili jini uzivatele. Myslim si, ze v tomto pripade ani
> standardizovane znackovani z LaTeXu moc nepomuze.
>
Pri konverzi z (La)TeXu do HTML se to vetsinou dela tak, ze se vzorecek
vysadi, ulozi jako obrazek (PNG nebo GIF) a vlozi. Vetsina webovych
prohlizecu totiz MathML neumi. Konverze matematickeho zapisu z TeXu ci
LaTeXu do MathML je nejspis mozna a mam pocit, ze jiz nejake takove
konvertitko existuje. Psat slozitejsi rovnici primo rucne v MathML je
masochismus.

> ----------
>
> On Thu, 4 Mar 2004, Zdenek Wagner wrote:
>
> > 1. Autor uz od pocatku kompletni text vklada do specialnich maker, u nichz
> > zmeni definici podle toho, zda bude vytvaret normalni DVI, nebo pomoci
> > \write HTML. Vse se programuje primo v (La)TeXu s minimem externich
> > nastroju
>
> To je presne to, co jsem udelal.
>
Moje makra lze najit ve Zpravodaji 1-3/2000 (tedy ne vse, ale dost
podrobnou ukazku), clanek se jmenuje "Spolupráce databáze s LaTeXem". Ja
jsem to mel jeste jednodussi v tom, ze vse bylo ulozeno v makrech, nebyl
tam zadny obycejny text, proto jsem nepotreboval \everypar. Sam jsem byl
prekvapen, jak se s touto strukturou da pomoci maker zachazet dost
flexibilne a delat to, co se v XML dela pomoci XSLT.

> > Mnohem jednodussi je, kdyz se puvodni zdroj napise v XML.
>
> S tim si nejsem tak docela jist. Jak kdy.
>
Ano, jak kdy, a zalezi na tom, co vse chci s dokumentem delat. V XML se da
validovat struktura dokumentu, a to velmi striktne. Napr. Relax NG se lze
naucit zhruba za 2 hodiny z tutorialu na Oasis. Pokud vsak nic takoveho
nepotrebujete a mate plainovsky zdrojak dobre strukturovane oznackovan,
pak je XML jen zbytecnym krokem navic.

Nyni jiz radu veci delam v XML, ale rozhodne ne vse. A navic mam pisarku,
kterou jsem za 15 minut naucil zaklady XML, takze je schopna opisovat
texty Wordem s prislusnymi znackami a po exportu jako prosty text mam XML
bez chyb. Word pouziva proto, ze ho umi a ma v tom Spellcheck, ale to uz
je OT...

> Zdravim
>
> Petr Olsak
>

Zdenek Wagner
e-mail: wagner at cesnet.cz

see also http://hroch486.icpf.cas.cz/wagner/
         http://icebearsoft.euweb.cz





More information about the csTeX mailing list