OOfice.org (nebo doc) ->LaTeX

Prochocky_Marian at sepsas.sk Prochocky_Marian at sepsas.sk
Thu Sep 23 14:59:14 CEST 2004


Na konverziu .doc -> .txt sa mi osvedcil antiword. Je velmi vhodny aj na
davkove spracovanie viacerych dokumentov z Wordu do cisteho textu. Je
multiplatformny, okrem vami pouzivanych OS/2 su k dispozicii verzie pre
prakticky vsetky bezne (aj zriedkavejsie) pouzivane OS (napr. aj pre PDA s
OS EPOC a Zaurus).

Vystup programu v terminali je na standardny vystup, preto je pre konverzie
potrebne presmerovat ho do suboru. Pre
dokumenty pouzivane u nas je prevdepodobne potrebne nastavit kodovanie na
cp1250 prepinacom, takze pouzitie:

antiword -m cp1250.txt dokument.doc > dokument.txt

Okrem prevodu do textu zvladne aj vytup do PostScriptu, kde je mozne
vydolovat z dokumentu bitmapove obrazky, ale ako vystup pre tlac to
pouzitelne velmi nie je. Textovy vystup je vsak dobre pouzitelny pre
nasledovne oznackovanie -- ci uz pre TeX, html alebo xml.

Antiword mozno najst na http://antiword.cjb.net/

--
Marian Prochocky






More information about the csTeX mailing list