imho.ws |
![]() |
![]() |
![]() |
# 1 |
Junior Member
Регистрация: 19.12.2001
Адрес: Israel
Сообщения: 184
![]() |
Допечатная подготовка книг
Думаю что я наверно не одинок к любви читать бумажные книги.
допустим есть книга отсканированая и распознаная ,но есть много одиночных слов которые не распознались и следовательно цвет фонта не достаточный для печати. в связи с этим возник вот такой вопрос : какими автоматическими способами можно привести даную книгу к нормальному печатному виду. ( ручная обработка каждого слова не подходит т.к. процент обработки очень не хилой ). Использовать можно всё ![]()
__________________
Хорошему человеку ничего не жалко |
![]() |
![]() |
# 3 |
Junior Member
Регистрация: 19.12.2001
Адрес: Israel
Сообщения: 184
![]() |
Заметил
![]() Начал сам тут воротить книжку Коннелл Джон Разработка элементов управления Microsoft .NET на Microsoft Visual Basic .NET.pdf так как читать в таком виде после печати нельзя прогнал через FR7 ну и ясное дело он серого текста почти не видит что подскажите ?? пока читаю коректирую но читать в FR не самое приятное ![]()
__________________
Хорошему человеку ничего не жалко |
![]() |
![]() |
# 5 |
Junior Member
Регистрация: 19.12.2001
Адрес: Israel
Сообщения: 184
![]() |
Проблема в другом
у меня есть книга которая ранее была кем то распознана и скорее всего не очень качественно как результат много слов которые не распознались и сохранились как картинки на светло сером фоне серые буквы перераспознать этот фаил не удаётся так как фр вообще пропускает эти слова или теряет большую часть слова скорее всего из за контраста оригинала скана у меня нет вот и пытаюсь колдовать с тем , что есть может есть какая то опция увеличить контраст для фн ?
__________________
Хорошему человеку ничего не жалко |
![]() |
![]() |
# 6 |
Member
Регистрация: 16.02.2002
Сообщения: 346
![]() ![]() ![]() ![]() ![]() |
Я вижу такой способ:
1. Полным Acrobat'om сохранить PDF как картинки (например, в многостраничный TIFF) с увеличением разрешения до 300 dpi. 2. Перераспознать FineReader'om. Если на этом этапе увеличить разрешение не удастся, то использовать специальные программы (наизусть не вспомню). Можно и в Photoshop, но я не знаю как там делать автоматом у всех файлов сразу. Ни пуха, ни пера |
![]() |
![]() |
# 10 |
::VIP::
Регистрация: 06.03.2003
Адрес: DZ, LBP, Moscow
Пол: Male
Сообщения: 633
![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() |
Я когда-то делал форматирование для печати книжки с помощью макроса для Word. Но при формировании страниц нарушалось расположение рисунков, таблиц и т.д.
Но для форматирования просто текста - подходит. Если надо - могу порытся в архивах.
__________________
Меня многие спрашивают, как я живу с тремя головами... На самом деле, я триедин, как Великие Бобы! |
![]() |
![]() |
# 11 |
Junior Member
Регистрация: 19.12.2001
Адрес: Israel
Сообщения: 184
![]() |
Goryn , проблема не в форматирование, а в распозновании текста
макрос не помешает для коллекции , но это из другой оперы если напрягает то не исчи так как не горит. Попробывал решить вопрос с распознованием так : сохранил страницу из ФР в серый тифф без компресии через ФотоШоп поигрался с настройками и поднял контраст изображения НО результат не впечатляет вообще распознать так и не смог . Вывод : проблема в начертании букв ,а не в их цвете ( контрасте ). решения этой проблемы у меня нет , только пересканировать книгу 2RenReg : не смог сохранить с повышенным DPI , не нашёл такой настройки в FR7Pro, подскажи где она . Вот наверно и всё по этому вопросу п.с. возможно всё таки кто-то знает как это решить , тогда ![]()
__________________
Хорошему человеку ничего не жалко |
![]() |
![]() |
# 12 | |
Member
Регистрация: 16.02.2002
Сообщения: 346
![]() ![]() ![]() ![]() ![]() |
Цитата:
Может ты ghiktim мне нераспознанный текст - я поиграюсь. Мыло - в профиле. Или выложи куда-нибудь |
|
![]() |
![]() |
# 13 | |
Full Member
Регистрация: 31.08.2003
Адрес: где-то между Марсом и Юпитером
Сообщения: 998
![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() |
Цитата:
http://lib.csu.ru/dl/bases/prg/kompr...Test/index.htm -- здесь написано, что он хорошо справляется при работе с так называемыми плохими текстами: факсами, ксерокопиями, текстами, отпечатанными на пишущей машинке или матричном принтере, документами, отсканированными в низком разрешении...
__________________
Старые игры раздают здесь |
|
![]() |
![]() |
# 14 |
Junior Member
Регистрация: 19.12.2001
Адрес: Israel
Сообщения: 184
![]() |
Ну что я скажу попробовал OCR CuneiForm 2000 результат не впечатляет
во первых при распозновании просит задать язык однозначно , а текст на 2-х языках это раз во вторых даже русский текст распознал хуже ФР 2renreg фаил занимает 20 метров архива , тебе не в тягость качать ? смотри лм
__________________
Хорошему человеку ничего не жалко |
![]() |