[cstex] TeX - OCR, pdf2tex apod.

Hajtmar Jaroslav hajtmar at gyza.cz
Wed Dec 6 01:16:17 CET 2023


Dobrý den.
Všeobecnou povědomost nemám, protože po spoustě různých pokusů s různými nástroji již několik let používám pro ty účely co píšete aplikaci MathPix (a s ní propojená webová aplikace http://snip.mathpix.com). Aplikace funguje buď na mobilním telefonu, tabletu nebo na počítači. Osobně pracuji s verzemi pro iOS, iPad a OS X, nicméně pokud vím tak existují i verze pro Windows a Android. Aplikace nejsou sice zdarma, ale fungují podle mne téměř dokonale. Používám několikrát týdně pro přípravu materiálů pro své studenty a efektivita práce je výjimečná.
Systém ovládá export (ofocených nebo PDF uploadnutých) dokumentů do Markdown, Mathpix Markdown, DOCX, LaTeX, HTML, PDF (with HTML), PDF (with LaTeX) a Overleaf.
Běžně fotím pomocí aplikace na mobilním telefonu nebo tabletu matematické vzorce či rovnice zapisované přímo na tabuli (bílé keramické nebo i černé křídové) nebo na papíře a ihned LaTeXový kód vkládám do svých TeXových nebo MarkDownových zdrojáků atd. Nebo pomocí aplikace snímám výřez obrazovky na níž mám matematický text ze sbírek příkladů či učebnic, nebo i z webových stránek atd. a ten se z aplikace okamžitě uploaduje do cloudu, kde je ihned dostupný na všech mých zařízeních popř. ve webové aplikaci http://snip.mathpix.com.

Osobně nevím o ničem lepším, což neznamená, že neexistuje třeba i lepší free řešení…
Podle mne jsou tyto nástroje stavěny na profesionální využítí a poměr výkon/cena je na takové úrovni, že rád jim roční pronájem platím ($49,99)

Doufám, že Vám budou tyto informace užitečné. Mám pocit, že existuje možnost nějaký čas vyzkoušet trialovou verzi zdarma… Pokud byste měl zájem o nějakou konkrétní konverzi, tak se na mne osobně obraťte, ať případně zjistíte jak to funguje.

Pěkný den všem v konferenci.
Jarda Hajtmar



5. 12. 2023 v 0:18, Jan Pospíšil <honik at kma.zcu.cz>:

Zdravím komunitu příznivců TeXu.

Chtěl bych se zeptat, jestli je tu někdo, kdo by měl přehled o aktuálním stavu poznání převodu bitmapových obrázků (např. scanovaných dokumentů) případně i PDF dokumentů (např. generovaných nějkým formátem TeXu) s textem (včetně matematických formulí, případně i jiných "objektů" jako jsou tabulky, (TikZ) obrázky, diagramy, notová sazba apod.) do (La)TeXového zdrojového kódu?

V rámci ML/DL boomu na mě nedávno vyskočila upoutávka na nástroj pix2tex
https://github.com/lukas-blecher/LaTeX-OCR

a tak jsem si vzpomněl na projekty související s DML-CZ (https://dml.cz), resp. EuDML (https://eudml.org), kde se tohle myslím také řešilo, ale už je to poměrně dávno. Žije ten vývoj ještě někde aktivně? Existují nějaké uspokojivější výstupy než třeba nabízí pdf2tex, FineReader, InftyReader apod.?

Předem díky za info.
J.P.
--
Jan Pospisil, Ph.D.
University of West Bohemia, Department of Mathematics
Univerzitni 2732/8, 301 00 Plzen, Czech Republic
honik at kma.zcu.cz, tel: (+420) 37763-2675

_______________________________________________
csTeX mailing list
csTeX at cs.felk.cvut.cz
https://lists.felk.cvut.cz/mailman/listinfo/cstex

-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://lists.felk.cvut.cz/pipermail/cstex/attachments/20231206/5762a5a3/attachment.htm>


More information about the csTeX mailing list