[cstex] OT: Generování textů pro dyslektické děti
Jan Sustek
Jan.Sustek at seznam.cz
Wed Jun 14 01:29:25 CEST 2023
Ahoj Jardo,
neni problem primo v TeXu najit mista pro deleni slov a na urovni TeXu s
nimi dale pracovat. Viz napriklad
https://petr.olsak.net/opmac-tricks.html#hyphprocess
Tam uz staci jenom namisto ridici sekvence \- vkladat ridici sekvenci \
prepinac a makro \prepinac nadefinovat tak, at se expanduje na stridacku na
\nobf a na \bf. (Nebo primo predefinovat \-.) To je reseni na par radku.
Jenom upozornim, ze toto je uloha nalezeni mist pro deleni slov. A Ty resis
ulohu najit hranice slabik. A to neni to same. Napriklad "sestra" se muze
zlomit libovolne "se-s-t-ra", coz by ve vysledku vypadalo jako ctyri
slabiky. Na druhou stranu algoritmus hledani mist muze hranici slabiky
neoznacit, kdyz ta hranice neni jednoznacna. Napriklad anglicke "minute"
nema misto pro deleni, protoze muze mit slabiky "mi-nute" nebo "min-ute".
Problem tohoto odstavce by se mohl vyresit pouzitim \hyphenation na zacatku
dokumentu pro ta slova, ktera ve vystupu uvidis, ze jsou spatne.
Mej se hezky.
Honza Sustek
---------- Původní e-mail ----------
Od: Hajtmar Jaroslav <hajtmar at gyza.cz>
Komu: Czech and Slovak TeX-related mailing list <csTeX at cs.felk.cvut.cz>
Datum: 13. 6. 2023 10:39:18
Předmět: [cstex] OT: Generování textů pro dyslektické děti
"Dobrý den.
Omlouvám se možná za trochu off topic, nicméně to možná někoho zaujme a
podívá se na problém z pohledu možností TeXu, tedy z pohledu, kterého nejsem
(vzhledem ke svým omezeným znalostem vnitřností TeXu) schopen.
Rád bych prokonzultoval možnost zajímavé aplikace TeXu pro tvorbu materiálů
pro dyslektické děti. Před časem jsem totiž narazil na nějaké pracovní
sešity pro dyslektické děti. Materiály jsou specifické tím, že dětem, které
mají problém se slabikováním a tím pádem se čtením obecně se dá k dispozici
text, ve kterém jsou vyznačeny slabiky - v tomto konkrétním případě to bylo
střídáním tučného a obyčejného písma. Kupodivu to docela funguje a zdá se,
že dyslektickým dětem to opravdu pomáhá (mám vyzkoušeno na vnukovi). Sehnat
vhodné knížky či pracovní listy není jednoduché.
Upozorňuji, že je zřejmě nutné vybírat pro dyslektické děti i nějaké
speciální texty, nějaké slovosledy atd… ale já se tím chtěl zabývat pouze na
základě zvýrazňování střídání slabik.
Přiznám se, že v první chvíli mne nenapadl přímo TeX, ale Ai, se kterou se v
poslední době snažím trochu seznámit. Vzhledem k tomu, že mi připadlo, že to
je přesně úkol pro Ai, tak jsem s tím začal experimentovat.
Je zajímavé, že Ai je schopna poměrně úspěšně (nikoliv stoprocentně, ale to
nevadí) slabiky oddělit pomlčkami. Při pokusech o střídající se zvýraznění
je úspěšnost již menší, Ai často při delších textech „zapomíná“ co měla
dělat a nakonec zvýrazňuje např. jen první slabiky slov atd..
Vzhledem k tomu, že komunikace probíhá v textovém režimu, tak jsem zprvu
zkoušel přimět Ai, aby značkovala slabiky pomocí HTML tagů, nakonec mne
napadlo, nechat označkovat slabiky pomocí TeXu a nechat si vygenerovat
TeXový zdroják a ten využít k tisku textů.
Dal jsem svůj příspěvek i do nějaké facebookové skupiny Ai, kde to řadu lidí
zaujalo. Našla se řada rádců, kteří mi radili to naprogramovat v Pythonu
atd… Ačkoliv nejsem profesionální programátor ani se nějak často k
programování nedostanu (Perl, Lua, Python, Pascal, atd. ) tak se mi zdá, že
programovat něco takového není elementární, protože ačkoliv není množina
slabik nějak zásadně početná, nenapadá mne, jak odlišit slabiky ve slovech
ko-mi-ník a kom-pre-sor atd… proto jsem tuto záležitost zvrhnul.
Napadlo mne, že TeX nějakým způsobem řeší dělení slov, takže na nějaké
hyphen tabulky dosáhne, takže by to možná teoreticky šlo, ale mé omezené
TeXové schopnosti mi nedovolují se těmito úvahami zabývat. Předpokládám, že
znalci TeXu budou schopni minimálně říci, zda je to teoreticky možné či
vyloučené.
TeX do toho tahám proto, že jsem ve finále nějaké kratší zdrojové texty pro
zpracování TeXem vytvořil pomocí Ai a nějakého pokroku dosáhl, nicméně na
sazbu nějaké knížky či delšího textu to moc není.
Nyní pro zájemce ukázka CharGPT promptu pro generování textů pro dyslektické
děti:
Zpracuj text pro dyslektické děti, které mají problém se čtením pomocí
slabikování textu. Z textu vytvoř TeXový kód tak, že v jednotlivých slovech
od sebe oddělíš jednotlivé slabiky, a to střídáním standardního a tučného
písma tak, aby bylo možno vizuálně jednotlivé slabiky od sebe odlišovat.
Vzor zpracování vypadá takto: (př. {\bf Ku}{\nobf kač}{\bf ka} {\bf ku}{\
nobf ka}{\bf la} {\nobf v} {\bf le}{\nobf se}. {\bf Koč}{\nobf ka} {\bf kou}
{\nobf ka}{\bf la} {\nobf na} {\bf te}{\nobf le}. {\bf Pes} {\nobf a} {\bf
vlk} {\nobf se} {\bf dí}{\nobf va}{\bf li} {\nobf na} {\bf mr}{\nobf kev}, {
\bf smrk}, {\bf kr}{\nobf ko}{\bf vič}{\nobf ku}, {\bf dr}{\nobf voš}{\bf
tě}{\nobf pa} {\nobf a} {\bf hr}{\nobf nec}.)
Zpracuj tímto způsobem následující text:
Vesmír je nekonečný. Ani si nejde představit, jak je velký. Je tam plno
planet a hvězd, dokonce i mléčná dráha. Spoustu vesmírných těles je neustále
v pohybu. Některé planety se pravidelně otáčejí ve stejném směru. I naše
planeta Země se pohybuje. Otáčí se kolem Slunce a kolem své osy. Díky tomu
máme noc, den a čtyři roční období. Jednou se ale stalo něco děsivého. Země
se zastavila.
Odpověď ChatGPT 4 je následující:
{\bf Ves}{\nobf mír} je {\bf ne}{\nobf ko}{\bf neč}{\nobf ný}. {\bf A}{\nobf
ni} si {\bf nej}{\nobf de} {\bf před}{\nobf sta}{\bf vit}, {\bf jak} je {\bf
vel}{\nobf ký}. {\bf Je} tam {\bf pl}{\nobf no} {\bf pla}{\nobf net} {\bf a}
{\bf hvězd}, {\bf do}{\nobf ko}{\bf nce} i {\bf mléč}{\nobf ná} {\bf drá}{\
nobf ha}. {\bf Spou}{\nobf stu} {\bf ves}{\nobf mír}{\bf ných} {\bf tě}{\
nobf les} je {\bf ne}{\nobf us}{\bf tá}{\nobf le} v {\bf po}{\nobf hy}{\bf
bu}. {\bf Ně}{\nobf které} {\bf pla}{\nobf ne}{\bf ty} se {\bf pra}{\nobf
vid}{\bf el}{\nobf ně} {\bf otá}{\nobf če}{\bf jí} ve {\bf stejném} {\bf
smě}{\nobf ru}. {\bf I} {\bf na}{\nobf še} {\bf pla}{\nobf ne}{\bf ta} {\bf
Ze}{\nobf mě} se {\bf po}{\nobf hy}{\bf bu}{\nobf je}. {\bf O}{\nobf tá}{\
nobf čí} se {\bf ko}{\nobf lem} {\bf Slun}{\nobf ce} {\bf a} {\bf ko}{\nobf
lem} {\bf své} {\bf osy}. {\bf Dí}{\nobf ky} {\bf to}{\nobf mu} {\bf má}{\
nobf me} {\bf noc}, {\bf den} {\bf a} {\bf čty}{\nobf ři} {\bf roč}{\nobf
ní} {\bf ob}{\nobf do}{\bf bí}. {\bf Je}{\nobf dnu} se {\bf a}{\nobf le} {\
bf sta}{\nobf lo} {\bf ně}{\nobf co} {\bf dě}{\nobf si}{\nobf vé}{\nobf ho}.
{\bf Ze}{\nobf mě} se {\bf za}{\nobf sta}{\nobf vi}{\nobf la}.
Je vidět, že střídání se moc nedaří, nicméně aspoň trochu použitelné to je.
Význam maker \bf a \nobf je asi zřejmý (\nobf jsem zvolil pro případ, že
bych chtěl značkování ještě trochu zobecnit). Printscreeen výsledku v TeXu
přikládat nemusím, protože si jistě dovedete představit, co na výstupu PDF
dostaneme.
Tolik pro zajímavost a inspiraci problémem. Nyní dotaz: Šlo by ten
algoritmus střídání slabik nějak řešit systémově přímo v TeXu nebo to
naprogramovat v nějakém vyšším jazyku? Nebo je to jen moje zcestná
představa?
Na konferenci se obracím, protože si myslím, že je zde mnoho učitelů, kteří
si dovedou představit o jaký problém z hlediska čtení se dnes jedná a znalci
TeXu nebo programátoři v různých programovacích jazycích možná přijdou s
nějakým nápadem… minimálně s nápadem tento koncept rychle opustit :-).
Díky za pozornost a za případné reakce, nápady atd..
Jarda Hajtmar
_______________________________________________
csTeX mailing list
csTeX at cs.felk.cvut.cz
https://lists.felk.cvut.cz/mailman/listinfo/cstex
"
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://lists.felk.cvut.cz/pipermail/cstex/attachments/20230614/7f9b9135/attachment.htm>
More information about the csTeX
mailing list