Adobe Acrobat умеет сохранять PDF во множестве форматов.
Если сохранение в *.rtf не помогает (причин может быть много:
текст в кривых, вставлен не текст а сканированое изображение и т.д.)
я сохраняю в *.tif без сжатия 300 - 600 dpi. Получаю по одной картинке на страницу. Потом всё это дело просто перетягиваю в Fine Reader и распознаю.
За две недели обработал сидюк с документацией (ок 800 документов от 20 до 200 страниц в каждом).
|