[cstex] vstupni kodovani csplainu, prosim o nazor

Thu Oct 4 14:49:55 CEST 2012

> Dobrý den,
> 
> On 4.10.2012 10:24, Petr Olsak wrote:
> > Otázka je, zda implicitně přejít na všech systémech na UTF8 (csplain je k 
> > tomu připraven např. s využitím encTeXu).
> 
> csplain nepoužívám, takže do toho asi nemám moc co mluvit, ale osobně
> bych se rozhodně klonil k implicitnímu předpokladu UTF-8 na vstupu.
> Pokud vím, tak UTF-8 je už pěkných pár let více méně standardní
> kódování úplně všude krom Windows a s trochou štěstí snad i Microsoft
> časem prohlédne (respektive on by asi i rád prohlédl, ale ocelové koule
> zpětné kompatibility u nohy se u Windows asi jen tak snadno nezbaví...).
> 
> UTF-8 je dnes opravdu masivně využívané a jeho výhody jsou zřejmé.
> Sehnat si na libovolném systému textový editor bez problému pracující v
> UTF-8 asi není velký problém. Nakonec i ten WinEd měl na UTF-8 přejít, ne?
> 
> > Ovšem csplain používají 
> > konzervativní lidé, kteří si spíše ohnou svůj systém na použití stejného 
> > kódování, jaké používali desítky let, než aby museli konvertovat veškerou 
> > archivovanou práci do nového kódování.
> 
> Tohle osobně považuji za cestu do pekel. Násilně ohýbat celý systém do
> starého kódování považuji za zbytečnost a dobrý způsob, jak si způsobit
> neočekávané problémy s těžko zjistitelnou příčinnou. Vývoj holt jde
> dopředu. A v IT to platí dvojnásob.
> 
> Staré dokumenty hromadně převádět netřeba, protože s největší
> pravděpodobností už je nikdo nikdy znovu zpracovávat nebude. A pokud
> ano, tak asi není velký problém je v tomto případě až dle potřeby
> převést do jiného kódování, respektive zpracující aplikaci sdělit, že
> vstup je v daném kódování a ta by si s tím měla umět poradit. (Velmi
> dobré by bylo, pokud by někde v dokumentu byla poznámka, v jakém že je
> kódování – stačí i parametr u inputenc v případě LaTeXu, komentář
> %&encoding=UTF-8 Unicode pro XeTeX, modeline pro Vim někde na konci
> souboru apod.)
> 
> Tak to tedy vidím já. :-)

Já to vidím naprosto stejně, jak jsem psal už včera, považuji to za jedinou
rozumnou alternativu těm metadatům v souborech.

Dodávám, že je potřeba těm konzervativním zdůraznit jednu věc: UTF-8 je
nadmnožina všech v ČR používaných osmibitových kódování, takže by neměl být
žádný problém s konverzí starých dokumentů, pokud ji někdo bude potřebovat.

Mimochodem, csTeX je jediný, kde jsem za poslední cca 3 roky přišel do
aktivního styku s jiným kódováním než UTF-8. A to používám Debian stable,
linuxovou distribuci, které se techničtí nadšenci vysmívají pro zastaralost.

Když přemýšlím, jaké by mohly být zádrhele, napadá mě jediný: jakmile bude
default UTF-8, tak není žádný logický důvod (z hlediska uživatele), proč
nezačít používat i jiné znaky ve zdrojovém souboru, třeba řecká písmena.

Milan Vančura