nezlomitelna mezera (WAS: LyX a vlna, opet cestina)

Petr Olsak olsak at math.feld.cvut.cz
Thu Oct 24 09:12:51 CEST 2002



On Wed, 23 Oct 2002, David Necas wrote:

> On Wed, Oct 23, 2002 at 12:09:25PM +0200, Hans Ginzel wrote:
> >
> > 	D. E. Knuth
> > 	28. 10. Sv Šimona a Judy
> >
> > Ukázka obsahuje nezlomitelné mezery (znak 160). Jak se Vám zobrazily?
>
> Mně v pohodě (Mutt(Debian) v rxvt(RedHat)).
>
> >     Budeme ochotni upravit naše programy, aby při testech na mezeru
> > počítali i s nezlomitelnou mezerou? Všechny ty tvrdé regulání výrazy
> > (neobsahující \s nebo [[:space:]])? Máme ke všem programům zdrojový kód?
> > Najde se dostatek uživatelů, kteří budou požadovat po svých
> > dodavatelích patche na klávesovou mapu? Najde se dostatek znalých lidí,
> > kteří uživatelům vysvětlí, že to mají chtít? Třeba v jazykovém koutku
> > některých novin? Kdo se obětuje?
>
> :o) správně s Unicode, přesněji alespoň s representací
> UTF-8. Přesvědčme uživatele, ať používají Unicode. Je to
> sice o dost težší, ale je to věc, která se dlouhodobě
> vyplatí. V případě TeXu by to asi mj. znamenalo přejít na
> Omegu, což je dost odvážný krok.
>
> Yeti

Svym prispevkem bych chtel vyvratit obecny mytus, ze UTF-8 si vynucuje
prechod na Omegu. Tento mytus prevlada napriklad na diskusi
k clanku http://www.root.cz/clanek.php4?id=1358.

Pro pouziti ceske a slovenske abecedy kodovane v UTF-8 v TeXu neni, podle
meho nazoru, nutne prechazet na Omegu. Staci dva tri radky maker.
Podle ceskych dokumentu v UTF-8 jsem totiz nabyl dojmu, ze se tam mota
jeden nebo dva prefixove znaky, za kterym nasleduji dalsi znak(y) a podle
toho se pozna, co to je za pismeno. Neni problem ty prefixove znaky udelat
aktivni a expandovat napr. do kodovani CSfontu. Na zacatku dokumentu by se
pak napsalo neco jako

\activeUTFeight

a bylo by vystarano. Zda se mi, ze se ty prefixove znaky vubec neperou se
znaky ceske a slovenske abecedy v ISO-8859-2, takze expanze do logu a do
\write souboru by nevadila a opakovane nacteni by normalne akceptovalo
vstupni kodovani ISO-8859-2, jak tomu je uz dlouho obvykle.
Mylim se snad?

Prechod na Omegu muze byt motivovan jednim z techto dvou potreb:

- pouziti 16bitovych TeXovych fontu, tj. fontu, kde potrebujeme definovat
  vzajemnou vazbu ligaturami a kerningovymi pary pro vice nez 256 znaku.
  To, domnivam se, neni pro provoz cestiny a slovesntiny vubec potreba.

- vyuziti konfigurovatelneho vstupniho pre-procesoru Omegy.
  Tim by se jiste UTF-8 dalo zvladnout, ale u takove triviality, jako
  je UTF-8 s ceskou a slovenskou abecedou si vystacime s jednoduchym
  makrem.

TeXiste si na TeXu mimo jine ceni jeho stabilitu, tezko tedy za teto
situace budou hromadne prechazet na neco, co je ve vyvoji. Tim myslim
Omegu. Podpora cestiny a slovenstiny totiz neni v Omeze resena, takze by
to znamenalo prechod na neco, co neni ustaleno a je ve vyvoji. To asi
TeXista hned tak neudela.

Petr Olsak









More information about the csTeX mailing list