[cstex] OT: Generování textů pro dyslektické děti

Wed Jun 14 01:29:25 CEST 2023

Ahoj Jardo,

neni problem primo v TeXu najit mista pro deleni slov a na urovni TeXu s 
nimi dale pracovat. Viz napriklad

https://petr.olsak.net/opmac-tricks.html#hyphprocess

Tam uz staci jenom namisto ridici sekvence \- vkladat ridici sekvenci \
prepinac a makro \prepinac nadefinovat tak, at se expanduje na stridacku na 
\nobf a na \bf. (Nebo primo predefinovat \-.) To je reseni na par radku.

Jenom upozornim, ze toto je uloha nalezeni mist pro deleni slov. A Ty resis 
ulohu najit hranice slabik. A to neni to same. Napriklad "sestra" se muze 
zlomit libovolne "se-s-t-ra", coz by ve vysledku vypadalo jako ctyri 
slabiky. Na druhou stranu algoritmus hledani mist muze hranici slabiky 
neoznacit, kdyz ta hranice neni jednoznacna. Napriklad anglicke "minute" 
nema misto pro deleni, protoze muze mit slabiky "mi-nute" nebo "min-ute". 
Problem tohoto odstavce by se mohl vyresit pouzitim \hyphenation na zacatku 
dokumentu pro ta slova, ktera ve vystupu uvidis, ze jsou spatne.

Mej se hezky.

Honza Sustek

---------- Původní e-mail ----------
Od: Hajtmar Jaroslav <hajtmar at gyza.cz>
Komu: Czech and Slovak TeX-related mailing list <csTeX at cs.felk.cvut.cz>
Datum: 13. 6. 2023 10:39:18
Předmět: [cstex] OT: Generování textů pro dyslektické děti
"Dobrý den.
Omlouvám se možná za trochu off topic, nicméně to možná někoho zaujme a 
podívá se na problém z pohledu možností TeXu, tedy z pohledu, kterého nejsem
(vzhledem ke svým omezeným znalostem vnitřností TeXu) schopen.

Rád bych prokonzultoval možnost zajímavé aplikace TeXu pro tvorbu materiálů 
pro dyslektické děti. Před časem jsem totiž narazil na nějaké pracovní 
sešity pro dyslektické děti. Materiály jsou specifické tím, že dětem, které 
mají problém se slabikováním a tím pádem se čtením obecně se dá k dispozici 
text, ve kterém jsou vyznačeny slabiky - v tomto konkrétním případě to bylo 
střídáním tučného a obyčejného písma. Kupodivu to docela funguje a zdá se, 
že dyslektickým dětem to opravdu pomáhá (mám vyzkoušeno na vnukovi). Sehnat 
vhodné knížky či pracovní listy není jednoduché.
Upozorňuji, že je zřejmě nutné vybírat pro dyslektické děti i nějaké 
speciální texty, nějaké slovosledy atd… ale já se tím chtěl zabývat pouze na
základě zvýrazňování střídání slabik.

Přiznám se, že v první chvíli mne nenapadl přímo TeX, ale Ai, se kterou se v
poslední době snažím trochu seznámit. Vzhledem k tomu, že mi připadlo, že to
je přesně úkol pro Ai, tak jsem s tím začal experimentovat.

Je zajímavé, že Ai je schopna poměrně úspěšně (nikoliv stoprocentně, ale to 
nevadí) slabiky oddělit pomlčkami. Při pokusech o střídající se zvýraznění 
je úspěšnost již menší, Ai často při delších textech „zapomíná“ co měla 
dělat a nakonec zvýrazňuje např. jen první slabiky slov atd..
Vzhledem k tomu, že komunikace probíhá v textovém režimu, tak jsem zprvu 
zkoušel přimět Ai, aby značkovala slabiky pomocí HTML tagů, nakonec mne 
napadlo, nechat označkovat slabiky pomocí TeXu a nechat si vygenerovat 
TeXový zdroják a ten využít k tisku textů.

Dal jsem svůj příspěvek i do nějaké facebookové skupiny Ai, kde to řadu lidí
zaujalo. Našla se řada rádců, kteří mi radili to naprogramovat v Pythonu 
atd… Ačkoliv nejsem profesionální programátor ani se nějak často k 
programování nedostanu (Perl, Lua, Python, Pascal, atd. ) tak se mi zdá, že 
programovat něco takového není elementární, protože ačkoliv není množina 
slabik nějak zásadně početná, nenapadá mne, jak odlišit slabiky ve slovech 
ko-mi-ník a kom-pre-sor atd… proto jsem tuto záležitost zvrhnul.
Napadlo mne, že TeX nějakým způsobem řeší dělení slov, takže na nějaké 
hyphen tabulky dosáhne, takže by to možná teoreticky šlo, ale mé omezené 
TeXové schopnosti mi nedovolují se těmito úvahami zabývat. Předpokládám, že 
znalci TeXu budou schopni minimálně říci, zda je to teoreticky možné či 
vyloučené. 

TeX do toho tahám proto, že jsem ve finále nějaké kratší zdrojové texty pro 
zpracování TeXem vytvořil pomocí Ai a nějakého pokroku dosáhl, nicméně na 
sazbu nějaké knížky či delšího textu to moc není. 

Nyní pro zájemce ukázka CharGPT promptu pro generování textů pro dyslektické
děti:

Zpracuj text pro dyslektické děti, které mají problém se čtením pomocí 
slabikování textu. Z textu vytvoř TeXový kód tak, že v jednotlivých slovech 
od sebe oddělíš jednotlivé slabiky, a to střídáním standardního a tučného 
písma tak, aby bylo možno vizuálně jednotlivé slabiky od sebe odlišovat.
Vzor zpracování vypadá takto: (př. {\bf Ku}{\nobf kač}{\bf ka} {\bf ku}{\
nobf ka}{\bf la} {\nobf v} {\bf le}{\nobf se}. {\bf Koč}{\nobf ka} {\bf kou}
{\nobf ka}{\bf la} {\nobf na} {\bf te}{\nobf le}. {\bf Pes} {\nobf a} {\bf 
vlk} {\nobf se} {\bf dí}{\nobf va}{\bf li} {\nobf na} {\bf mr}{\nobf kev}, {
\bf smrk}, {\bf kr}{\nobf ko}{\bf vič}{\nobf ku}, {\bf dr}{\nobf voš}{\bf 
tě}{\nobf pa} {\nobf a} {\bf hr}{\nobf nec}.)
Zpracuj tímto způsobem následující text:
Vesmír je nekonečný. Ani si nejde představit, jak je velký. Je tam plno 
planet a hvězd, dokonce i mléčná dráha. Spoustu vesmírných těles je neustále
v pohybu. Některé planety se pravidelně otáčejí ve stejném směru. I naše 
planeta Země se pohybuje. Otáčí se kolem Slunce a kolem své osy. Díky tomu 
máme noc, den a čtyři roční období. Jednou se ale stalo něco děsivého. Země 
se zastavila.

Odpověď ChatGPT 4 je následující:

{\bf Ves}{\nobf mír} je {\bf ne}{\nobf ko}{\bf neč}{\nobf ný}. {\bf A}{\nobf
ni} si {\bf nej}{\nobf de} {\bf před}{\nobf sta}{\bf vit}, {\bf jak} je {\bf
vel}{\nobf ký}. {\bf Je} tam {\bf pl}{\nobf no} {\bf pla}{\nobf net} {\bf a}
{\bf hvězd}, {\bf do}{\nobf ko}{\bf nce} i {\bf mléč}{\nobf ná} {\bf drá}{\
nobf ha}. {\bf Spou}{\nobf stu} {\bf ves}{\nobf mír}{\bf ných} {\bf tě}{\
nobf les} je {\bf ne}{\nobf us}{\bf tá}{\nobf le} v {\bf po}{\nobf hy}{\bf 
bu}. {\bf Ně}{\nobf které} {\bf pla}{\nobf ne}{\bf ty} se {\bf pra}{\nobf 
vid}{\bf el}{\nobf ně} {\bf otá}{\nobf če}{\bf jí} ve {\bf stejném} {\bf 
smě}{\nobf ru}. {\bf I} {\bf na}{\nobf še} {\bf pla}{\nobf ne}{\bf ta} {\bf 
Ze}{\nobf mě} se {\bf po}{\nobf hy}{\bf bu}{\nobf je}. {\bf O}{\nobf tá}{\
nobf čí} se {\bf ko}{\nobf lem} {\bf Slun}{\nobf ce} {\bf a} {\bf ko}{\nobf 
lem} {\bf své} {\bf osy}. {\bf Dí}{\nobf ky} {\bf to}{\nobf mu} {\bf má}{\
nobf me} {\bf noc}, {\bf den} {\bf a} {\bf čty}{\nobf ři} {\bf roč}{\nobf 
ní} {\bf ob}{\nobf do}{\bf bí}. {\bf Je}{\nobf dnu} se {\bf a}{\nobf le} {\
bf sta}{\nobf lo} {\bf ně}{\nobf co} {\bf dě}{\nobf si}{\nobf vé}{\nobf ho}.
{\bf Ze}{\nobf mě} se {\bf za}{\nobf sta}{\nobf vi}{\nobf la}.

Je vidět, že střídání se moc nedaří, nicméně aspoň trochu použitelné to je. 
Význam maker \bf a \nobf je asi zřejmý (\nobf jsem zvolil pro případ, že 
bych chtěl značkování ještě trochu zobecnit). Printscreeen výsledku v TeXu 
přikládat nemusím, protože si jistě dovedete představit, co na výstupu PDF 
dostaneme.

Tolik pro zajímavost a inspiraci problémem. Nyní dotaz: Šlo by ten 
algoritmus střídání slabik nějak řešit systémově přímo v TeXu nebo to 
naprogramovat v nějakém vyšším jazyku? Nebo je to jen moje zcestná 
představa? 

Na konferenci se obracím, protože si myslím, že je zde mnoho učitelů, kteří 
si dovedou představit o jaký problém z hlediska čtení se dnes jedná a znalci
TeXu nebo programátoři v různých programovacích jazycích možná přijdou s 
nějakým nápadem… minimálně s nápadem tento koncept rychle opustit :-).

Díky za pozornost a za případné reakce, nápady atd..

Jarda Hajtmar

_______________________________________________
csTeX mailing list
csTeX at cs.felk.cvut.cz
https://lists.felk.cvut.cz/mailman/listinfo/cstex
"
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://lists.felk.cvut.cz/pipermail/cstex/attachments/20230614/7f9b9135/attachment.htm>