[cstex] vstupni kodovani csplainu, prosim o nazor

Thu Oct 4 15:10:37 CEST 2012

On 4.10.2012 14:49, Milan Vancura wrote:
>> Dobrý den,
>>
>> On 4.10.2012 10:24, Petr Olsak wrote:
>>> Otázka je, zda implicitně přejít na všech systémech na UTF8 (csplain je k 
>>> tomu připraven např. s využitím encTeXu).
>>
>> csplain nepoužívám, takže do toho asi nemám moc co mluvit, ale osobně
>> bych se rozhodně klonil k implicitnímu předpokladu UTF-8 na vstupu.
>> Pokud vím, tak UTF-8 je už pěkných pár let více méně standardní
>> kódování úplně všude krom Windows a s trochou štěstí snad i Microsoft
>> časem prohlédne (respektive on by asi i rád prohlédl, ale ocelové koule
>> zpětné kompatibility u nohy se u Windows asi jen tak snadno nezbaví...).
>>
>> UTF-8 je dnes opravdu masivně využívané a jeho výhody jsou zřejmé.
>> Sehnat si na libovolném systému textový editor bez problému pracující v
>> UTF-8 asi není velký problém. Nakonec i ten WinEd měl na UTF-8 přejít, ne?
>>
>>> Ovšem csplain používají 
>>> konzervativní lidé, kteří si spíše ohnou svůj systém na použití stejného 
>>> kódování, jaké používali desítky let, než aby museli konvertovat veškerou 
>>> archivovanou práci do nového kódování.
>>
>> Tohle osobně považuji za cestu do pekel. Násilně ohýbat celý systém do
>> starého kódování považuji za zbytečnost a dobrý způsob, jak si způsobit
>> neočekávané problémy s těžko zjistitelnou příčinnou. Vývoj holt jde
>> dopředu. A v IT to platí dvojnásob.
>>
>> Staré dokumenty hromadně převádět netřeba, protože s největší
>> pravděpodobností už je nikdo nikdy znovu zpracovávat nebude. A pokud
>> ano, tak asi není velký problém je v tomto případě až dle potřeby
>> převést do jiného kódování, respektive zpracující aplikaci sdělit, že
>> vstup je v daném kódování a ta by si s tím měla umět poradit. (Velmi
>> dobré by bylo, pokud by někde v dokumentu byla poznámka, v jakém že je
>> kódování – stačí i parametr u inputenc v případě LaTeXu, komentář
>> %&encoding=UTF-8 Unicode pro XeTeX, modeline pro Vim někde na konci
>> souboru apod.)
>>
>> Tak to tedy vidím já. :-)
> 
> Já to vidím naprosto stejně, jak jsem psal už včera, považuji to za jedinou
> rozumnou alternativu těm metadatům v souborech.
> 
> Dodávám, že je potřeba těm konzervativním zdůraznit jednu věc: UTF-8 je
> nadmnožina všech v ČR používaných osmibitových kódování, takže by neměl být
> žádný problém s konverzí starých dokumentů, pokud ji někdo bude potřebovat.
> 
> Mimochodem, csTeX je jediný, kde jsem za poslední cca 3 roky přišel do
> aktivního styku s jiným kódováním než UTF-8. A to používám Debian stable,
> linuxovou distribuci, které se techničtí nadšenci vysmívají pro zastaralost.
> 
> Když přemýšlím, jaké by mohly být zádrhele, napadá mě jediný: jakmile bude
> default UTF-8, tak není žádný logický důvod (z hlediska uživatele), proč
> nezačít používat i jiné znaky ve zdrojovém souboru, třeba řecká písmena.

Teď mne tak napadlo, více méně mimo toto téma, má XeTeX oproti CsTeXu
nějakou zásadní nevýhodu krom toho, co je dáno z jeho podstaty (tzn.
teoretická možnost různého zlomu na různých operačních systémech kvůli
závislosti na implementaci práce s fonty)?

Před pár dny jsem dostal od jednoho studenta otázku, proč se XeTeX
nepoužívá jako defaultní TeX engine. Pokud pomineme dříve vzniklé
dokumenty, je dnes zásadní důvod začít psát nový dokument v csplainu a
ne pod XeTeXem?

--mr

> Milan Vančura
> _______________________________________________
> csTeX mailing list
> csTeX at cs.felk.cvut.cz
> http://lists.felk.cvut.cz/mailman/listinfo/cstex

-- 
Michal Růžička <xruzick7 at fi.muni.cz>
OpenPGP key: https://www.fi.muni.cz/~xruzick7/pgp-klic/
Fingerprint: 1CB2 41B9 F029 4B47 EECD  9BDA 90C9 CEB0 524C DACB