UTF-8 (jen latinka) do TeXu?

Petr Sojka sojka at fi.muni.cz
Fri Jul 14 00:17:13 CEST 2006


On Wed, Jul 12, 2006 at 05:04:27PM +0200, Jan Kasprzak wrote:
Dobry den,

> predelavam vetsi system, ktery mimo jine pouziva TeX na tiskove vystupy,
> z interniho kodovani ISO 8859-2 do UTF-8. Pro tiskove vystupy mi v podstate
> staci, abych byl schopen do TeXu dostat latinkove znaky (v podstate
> sjednoceni ISO 8859-1, 2, a Windows-1250).
Pak by melo (aspon pro LaTeX) stacit \usepackage[T1]{fontenc}.
> nektere tiskove vystupy jdou pres csplain, jine pres cslatex, a jine
> pres latex (s czech.sty a [latin2]{inputenc}). Potreboval bych nejaky
A coz to zkusit unifikovat aspon pres
\begin{plain} ...
\end{plain}
okoli LaTeXu?
> prostredek (staci prevodni tabulka), ktery by mi prevedl podmnozinu
> UTF-8 do TeXovych maker (ceske a slovenske znaky ponechat tak kvuli deleni
> slov,
V LaTeXu mohu mit vstup sedmibitovy a stale delt, napr. klidne zafunguje
kodovat znaky jako \char<cislo> dle tex testfont ecrm1000 a pri spravne
zapnutych vzorech se bude stale delit.
> ostatni vysazet "aspon nejak", cili treba pres \accent).
> Existuje neco takoveho?
Pro zminena kodovani lze vyjit z .def souboru LaTeXu, viz napr.
kpsewhich cp1250.def
>
> 	Pripadne, jaka je standardni cesta jak psat v csplainu, latexu
> a cslatexu aspon nasledujici znaky:
>
> Polske aogonek, Aogonek, eogonek, Eogonek (U+0105, U+0104, U+0119, U+0118).
> Samostatne diakriticke znacky (hacek U+02C7, carka U+00B4, cedilla U+00B8, atd).
> Preskrtnute D a d (U+0110, U+0111)
> Islandske Eth a eth (U+00D0, U+00F0), Thorn, thorn (U+00DE, U+00FE)
> Francouzske uvozovky >> a << (U+00BB, U+00AB) a jednoduche uvozovky > a <
> 	(U+203A, U+2039)
> Dolni "9" uvozovky (U+201E)

V csplainu zadna (az na tech par maker v plain.tex), v LaTeXu viz
ty .def soubory.
--ps



More information about the csTeX mailing list