[cstex] OFF TOPIC: Problém s kódováním souboru (různé znakové sady pohromadě???)

Jiří Rybička rybicka at mendelu.cz
Wed Feb 13 00:32:48 CET 2013


Dobrý den,
tady je každá rada drahá, ale můžu z vlastní zkušenosti říct, že PSPad je
editor obsahující řadu velmi nepříjemných chyb, a to i v oblasti
rozpoznávání kódování a správného zobrazování textu. Například jeden můj soubor, který
byl v PCLatin 2, tvrdošíjně otvíral v CP1250 a nedal si za žádné konstelace
různých nastavení říct.

Doporučení -- jiný editor, mnohdy udělá dobrou službu i jednodušší nástroj,
v němž lze alespoň soubor rozsekat na části a s nimi si pak hrát samostatně.

Používám na unixech editor joe -- taky mě občas vypeče, ale zase jiným
způsobem. Kombinací několika editorů se možná dostanete k cíli. Taky může
pomoci unixový nástroj enca, kterým zjistíte kódování, samozřejmě v
nemixovaném souboru.

Zdravím
JR.

Tue, Feb 12, 2013 ve 11:54:59PM +0100 Jaroslav Hajtmar napsal(a):
# Dobrý den.
# 
# Velmi se omlouvám za off-topic, ale vzhledem k tomu, že je mezi vámi
# mnoho expertů, tak se pokusím vás požádat o radu.
# 
# Vyexportoval jsem jednomu kamarádovi velkou MySQL databázi v níž
# bylo zřejmě mnoho různě kódovaných tabulek. Některá data byla zřejmě
# kódovaná CP1250, něco v UTF-8, dost stará data celkem kolem 12MB
# dat.
# Vtuto chvíli mám dump databáze ve formátu sql - je to textový
# soubor, který když otevřu PSPadem, tak je část textu zcela
# nečitelná...
# 
# Bohužel je již hosting i s databází již zrušen, takže už nemám
# možnost provést DUMP databáze metodou per-partes.
# 
# Zkoušel jsem vydumpovaný soubor dekódovat různými metodami - zapínat
# a vypínat automatické rozpoznání kódování, zapínat a vypínat různá
# kódování tak, abych několik z tabulek (ke konci souboru) nějakým
# způsobem zachránil, abych mohl zpět ta data zapsat do databáze tak
# aby byla čitelná...
# 
# Jsou to pro mne velmi důležitá data a teď jsem docela nahraný.
# Zkoušel jsem i odmazat úvodní část dat a pak ta zbývající data nějak
# načíst s automatickým rozpoznáním kódování, ale pořád niczásadního.
# Drobný úspěch jsem zaznamenal, když malá (editorem vyřízlá) část
# souboru se najedkou jeví jako čitelná, nicméně nejsem schopen už tu
# akci nějak zopakovat.
# 
# Neznáte, prosím, nějaký SW, který by to dokázal nějak přechroustat a
# oddělit od sebe různá kódování atd?
# Lze nějakým editorem "vyříznout" část dat a uložit to tak aby tam
# zůstalo jen to kódování které potřebuju?
# Nebo aspoň nějaký nápad, co by se s tím dalo dělat...
# 
# Díky za případné rady a ještě jednou se omlouvám za off topic
# 
# Jarda Hajtmar
# 
# _______________________________________________
# csTeX mailing list
# csTeX at cs.felk.cvut.cz
# http://lists.felk.cvut.cz/mailman/listinfo/cstex



More information about the csTeX mailing list