![]() |
Допечатная подготовка книг
Думаю что я наверно не одинок к любви читать бумажные книги.
допустим есть книга отсканированая и распознаная ,но есть много одиночных слов которые не распознались и следовательно цвет фонта не достаточный для печати. в связи с этим возник вот такой вопрос : какими автоматическими способами можно привести даную книгу к нормальному печатному виду. ( ручная обработка каждого слова не подходит т.к. процент обработки очень не хилой ). Использовать можно всё :p |
Перенёс.
|
Заметил :yees:
Начал сам тут воротить книжку Коннелл Джон Разработка элементов управления Microsoft .NET на Microsoft Visual Basic .NET.pdf так как читать в таком виде после печати нельзя прогнал через FR7 ну и ясное дело он серого текста почти не видит что подскажите ?? пока читаю коректирую но читать в FR не самое приятное :confused: |
FineReader распознает хорошо (и это понятно), если оригинал сканировался с разрешением 300 dpi. Перераспознай с увеличение разрешения оригинала. Может помочь.
|
Проблема в другом
у меня есть книга которая ранее была кем то распознана и скорее всего не очень качественно как результат много слов которые не распознались и сохранились как картинки на светло сером фоне серые буквы перераспознать этот фаил не удаётся так как фр вообще пропускает эти слова или теряет большую часть слова скорее всего из за контраста оригинала скана у меня нет вот и пытаюсь колдовать с тем , что есть может есть какая то опция увеличить контраст для фн ? |
Я вижу такой способ:
1. Полным Acrobat'om сохранить PDF как картинки (например, в многостраничный TIFF) с увеличением разрешения до 300 dpi. 2. Перераспознать FineReader'om. Если на этом этапе увеличить разрешение не удастся, то использовать специальные программы (наизусть не вспомню). Можно и в Photoshop, но я не знаю как там делать автоматом у всех файлов сразу. Ни пуха, ни пера |
Ещё есть такая штука как ABBYY PDF Transformer, можно попробовать.
|
Цитата:
|
трансформер не думаю что поможет , это тот же финереадер
|
Я когда-то делал форматирование для печати книжки с помощью макроса для Word. Но при формировании страниц нарушалось расположение рисунков, таблиц и т.д.
Но для форматирования просто текста - подходит. Если надо - могу порытся в архивах. |
Goryn , проблема не в форматирование, а в распозновании текста
макрос не помешает для коллекции , но это из другой оперы если напрягает то не исчи так как не горит. Попробывал решить вопрос с распознованием так : сохранил страницу из ФР в серый тифф без компресии через ФотоШоп поигрался с настройками и поднял контраст изображения НО результат не впечатляет вообще распознать так и не смог . Вывод : проблема в начертании букв ,а не в их цвете ( контрасте ). решения этой проблемы у меня нет , только пересканировать книгу 2RenReg : не смог сохранить с повышенным DPI , не нашёл такой настройки в FR7Pro, подскажи где она . Вот наверно и всё по этому вопросу п.с. возможно всё таки кто-то знает как это решить , тогда :help: |
Цитата:
Может ты ghiktim мне нераспознанный текст - я поиграюсь. Мыло - в профиле. Или выложи куда-нибудь |
Цитата:
http://lib.csu.ru/dl/bases/prg/kompr...Test/index.htm -- здесь написано, что он хорошо справляется при работе с так называемыми плохими текстами: факсами, ксерокопиями, текстами, отпечатанными на пишущей машинке или матричном принтере, документами, отсканированными в низком разрешении... |
Ну что я скажу попробовал OCR CuneiForm 2000 результат не впечатляет
во первых при распозновании просит задать язык однозначно , а текст на 2-х языках это раз во вторых даже русский текст распознал хуже ФР 2renreg фаил занимает 20 метров архива , тебе не в тягость качать ? смотри лм |
Часовой пояс GMT +4, время: 02:53. |
Powered by vBulletin® Version 3.8.5
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.