IMHO.WS

IMHO.WS (http://www.imho.ws/index.php)
-   Обсуждение программ (http://www.imho.ws/forumdisplay.php?f=3)
-   -   Распознавание Pdf (http://www.imho.ws/showthread.php?t=37473)

Occtider 26.08.2003 04:21

Распознавание Pdf
 
Часто при оцифровывании литературы многие ленятся и не распознают текст, а оставляя его картинками преобразуют в пдф (или еще черт знает во что).
Есть ли плагин к FineReaderу или отдельная программа, которая позволяет распознать текст из ПДФ?
Обидно, паршивенький манулал занимает мега, хотя текста там 100 кило. Да даже не в объеме дело, поиск реализовать невозможно.

Dead Man 26.08.2003 09:00

Разложи ПДФ на картинки, и распозновай их.

renreg 26.08.2003 13:11

FineReader 6 распознает PDF без "разложения" на картинки. Если PDF сделан в формате последней версии 1.5, то нужен сервиспак

dr-evil 26.08.2003 17:34

есть прога-аддон для Ворда...
OpenPDF зовется... PDF позволяет в Ворде открывать

Bosmr 26.08.2003 17:39

Дык ведь еще и Adobe Acrobat есть... чем он плох?

Occtider 27.08.2003 03:47

Dead Man
Разложить на картинки это мне что, скрины делать? А если их 200?

dr-evil
Я чего то недопераю, зачем мне их в ворде открывать? будет гора картинок. Мне же надо преобразовать pdf в, например, html.

renreg
Раздобуду ФР6, обязательно попробую.

Bosmr
Причем тут акробат?

dr-evil 27.08.2003 05:05

Occtider
а сохранить вордой в хтмл?

Dead Man 27.08.2003 05:11

Occtider
в Adobe Acrobat 6 есть спец. функция, экспорт пикчеров, выделяй все и вперёд, потом загониш их в FineReader.

Удачи.

Bosmr 27.08.2003 12:13

Occtider


Цитата:

Dead Man
в Adobe Acrobat 6 есть спец. функция, экспорт пикчеров, выделяй все и вперёд, потом загониш их в FineReader.
Во-во, ну или на крайняк, можешь оттуда просто текст вытащить через буфер.

maxko 27.08.2003 12:30

Occtider
Берешь Acrobat Reader 5.0 Full version (которая позволяет не только читать, но и работать над документом), все выделяешь и копируешь куда хочешь. What's the problem ....?

Bosmr 27.08.2003 12:38

maxko
Только наверно все же, не Adobe Acrobat Reader, а просто Adobe Acrobat.

renreg 27.08.2003 17:00

Можно и Acrobat 6 уже ставить. Но выделить и копировать может не помочь, если шрифты предварительно перевели в кривые. Это часть делается при экспорте и графических программ. Такие уже не выделишь. Поэтому Occtider идет правильные путем - распознаванием. FineReadrer очень качественно распознает и экспортирует текст, например, в тот же Word вместе с картинкми. Причем, если верстка простая,то сохраняет и форматирование. А из Word куда и что хочешь.

Bosmr 27.08.2003 17:25

Да... я забыл сказать... графика в этом случае не берется...
Забирается только текст.

Dead Man 27.08.2003 22:26

Bosmr
maxko

Не говорите глупости, это не тот вариант, прочитайте внимательно вопрос "а оставляя его картинками преобразуют в пдф", в этом случае у него просто КАРТИНКА, выбрать из неё текст НЕ ВОЗМОЖНО. Идти надо только моим методом. Сохранять картинку, и потом распозновать.

renreg 27.08.2003 23:08

Dead Man
Зачем делать лишнее движение? FineRedaer 6 распознает PDF

Dead Man 27.08.2003 23:13

renreg

Тоже верно.

Bosmr 27.08.2003 23:54

Dead Man
Упс.... был не прав.
Я понял что инструкция набита текстом в PDF, а не преобразована как картинка.
Извиняюсь.

Occtider 28.08.2003 03:28

Сошлись на ФР6. Спасибо.

joker99 29.08.2003 01:10

в одном из последних номеров cooler.it била прога для преобразования pdf->html


Часовой пояс GMT +4, время: 08:25.

Powered by vBulletin® Version 3.8.5
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.