Есть две программы:
GOCR (GNU Optical Character Recognition)
_http://jocr.sourceforge.net/
_http://sourceforge.net/projects/jocr/
и
Infty Editor + Infty Reader
_http://www.inftyproject.org/index-e.html
_http://www.caisystem.co.jp/infty/e/index.html
Насчет первой - OCR-пакета - информация самая противоречивая:
в документации по GOCR и библиотеке к ней libGOCR
утверждения В ЯВНОМ ВИДЕ, что она распознает математические формулы
я не нашел.
Но в переписке разработчиков гокра
(_http://sourceforge.net/mailarchive/forum.php?forum=jocr-devels), например, здесь
_http://sourceforge.net/mailarchive/message.php?msg_id=6869458
это написано черным по белому.
Ситуация осложняется тем, что если гокр доступен в экзешнике
(требующем притом внешнего интерфейса, например tcl, а также
конвертор графических форматов, например PMView или NetPBM,
т.к. на вход надо подавать .pbm-файлы),
то необходимый либгокр доступен только в исходниках.
По поводу второй программы:
это WYSIWYG-редактор под формат LaTeX + OCR-пакет для математических формул с приятным интерфейсом.
На вход надо подавать .tiff (но не любой, например, GROUP4 подходит,
а LZW нет) с разрешением 400 или 600 dpi, на выходе, пишут, можно
получить LaTeX/HTML/MathML/TXT. Но здесь свои проблемы:
у меня под Windows XP (service pack 1) + Internet Explorer 6.0 появляется сообщение:
Microsoft Visual C++ Runtime Library
Runtime Error!
Program C:\Program Files\CAI-SYSTEM\InftyEditor\InftyEd2.exe
abnormal program termination
Кто-нибудь знает, что делать?