IMHO.WS - Допечатная подготовка книг

IMHO.WS (http://www.imho.ws/index.php)

- Обсуждение программ (http://www.imho.ws/forumdisplay.php?f=3)

- - Допечатная подготовка книг (http://www.imho.ws/showthread.php?t=79745)

Zaber

13.02.2005 18:27

Допечатная подготовка книг

Думаю что я наверно не одинок к любви читать бумажные книги.
допустим есть книга отсканированая и распознаная ,но есть много одиночных слов которые не распознались и следовательно цвет фонта не достаточный для печати.
в связи с этим возник вот такой вопрос :
какими автоматическими способами можно привести даную книгу к нормальному печатному виду.
( ручная обработка каждого слова не подходит т.к. процент обработки очень не хилой ).
Использовать можно всё :p

Георг

13.02.2005 19:50

Перенёс.

Zaber

13.02.2005 22:12

Заметил :yees:

Начал сам тут воротить книжку
Коннелл Джон Разработка элементов управления Microsoft .NET на Microsoft Visual Basic .NET.pdf
так как читать в таком виде после печати нельзя
прогнал через FR7 ну и ясное дело он серого текста почти не видит
что подскажите ??
пока читаю коректирую но читать в FR не самое приятное :confused:

renreg

15.02.2005 19:32

FineReader распознает хорошо (и это понятно), если оригинал сканировался с разрешением 300 dpi. Перераспознай с увеличение разрешения оригинала. Может помочь.

Zaber

15.02.2005 22:54

Проблема в другом
у меня есть книга которая ранее была кем то распознана и скорее всего не очень качественно как результат много слов которые не распознались и сохранились как картинки на светло сером фоне серые буквы
перераспознать этот фаил не удаётся так как фр вообще пропускает эти слова или теряет большую часть слова скорее всего из за контраста

оригинала скана у меня нет
вот и пытаюсь колдовать с тем , что есть
может есть какая то опция увеличить контраст для фн ?

renreg

16.02.2005 07:14

Я вижу такой способ:
1. Полным Acrobat'om сохранить PDF как картинки (например, в многостраничный TIFF) с увеличением разрешения до 300 dpi.
2. Перераспознать FineReader'om.

Если на этом этапе увеличить разрешение не удастся, то использовать специальные программы (наизусть не вспомню). Можно и в Photoshop, но я не знаю как там делать автоматом у всех файлов сразу.

Ни пуха, ни пера

topknot

16.02.2005 10:26

Ещё есть такая штука как ABBYY PDF Transformer, можно попробовать.

renreg

16.02.2005 11:10

Цитата:

Сообщение от topknot

Ещё есть такая штука как ABBYY PDF Transformer, можно попробовать.

Ты его устанавливал? Это, на мой взгляд, урезанная версия FineReader

Zaber

17.02.2005 18:59

трансформер не думаю что поможет , это тот же финереадер

Goryn

17.02.2005 20:14

Я когда-то делал форматирование для печати книжки с помощью макроса для Word. Но при формировании страниц нарушалось расположение рисунков, таблиц и т.д.
Но для форматирования просто текста - подходит.

Если надо - могу порытся в архивах.

Zaber

17.02.2005 21:53

Goryn , проблема не в форматирование, а в распозновании текста
макрос не помешает для коллекции , но это из другой оперы
если напрягает то не исчи так как не горит.
Попробывал решить вопрос с распознованием так :
сохранил страницу из ФР в серый тифф без компресии
через ФотоШоп поигрался с настройками и поднял контраст изображения
НО результат не впечатляет вообще распознать так и не смог .
Вывод : проблема в начертании букв ,а не в их цвете ( контрасте ).
решения этой проблемы у меня нет , только пересканировать книгу

2RenReg : не смог сохранить с повышенным DPI , не нашёл такой настройки в FR7Pro, подскажи где она .

Вот наверно и всё по этому вопросу
п.с. возможно всё таки кто-то знает как это решить , тогда :help:

renreg

18.02.2005 11:19

Цитата:

Сообщение от Zaber

RenReg : не смог сохранить с повышенным DPI , не нашёл такой настройки в FR7Pro, подскажи где она

При распознавании FineReader дожен тебя предупреждать. Какая у тебя версия FineReader?

Может ты ghiktim мне нераспознанный текст - я поиграюсь. Мыло - в профиле.
Или выложи куда-нибудь

CEO	18.02.2005 13:13

Цитата:

Zaber:2RenReg : не смог сохранить с повышенным DPI , не нашёл такой настройки в FR7Pro, подскажи где она .

Думаю что даже если бы и смог, толку никакого не было бы. Сканировать надо было с большим разрешением. Что касается распознования, есть ведь не только файнридер. Попробуй OCR CuneiForm 2000 .
http://lib.csu.ru/dl/bases/prg/kompr...Test/index.htm -- здесь написано, что он хорошо справляется при работе с так называемыми плохими текстами: факсами, ксерокопиями, текстами, отпечатанными на пишущей машинке или матричном принтере, документами, отсканированными в низком разрешении...

Zaber

19.02.2005 23:25

Ну что я скажу попробовал OCR CuneiForm 2000 результат не впечатляет
во первых при распозновании просит задать язык однозначно , а текст на 2-х языках это раз
во вторых даже русский текст распознал хуже ФР

2renreg фаил занимает 20 метров архива , тебе не в тягость качать ?
смотри лм

Часовой пояс GMT +4, время: 02:53.