imho.ws
IMHO.WS  

Вернуться   IMHO.WS > Программы и Операционные системы > Обсуждение программ
Опции темы
Старый 13.02.2005, 18:27     # 1
Zaber
Junior Member
 
Аватар для Zaber
 
Регистрация: 19.12.2001
Адрес: Israel
Сообщения: 184

Zaber Путь к славе только начался
Допечатная подготовка книг

Думаю что я наверно не одинок к любви читать бумажные книги.
допустим есть книга отсканированая и распознаная ,но есть много одиночных слов которые не распознались и следовательно цвет фонта не достаточный для печати.
в связи с этим возник вот такой вопрос :
какими автоматическими способами можно привести даную книгу к нормальному печатному виду.
( ручная обработка каждого слова не подходит т.к. процент обработки очень не хилой ).
Использовать можно всё
__________________
Хорошему человеку ничего не жалко
Zaber вне форума  
Старый 13.02.2005, 19:50     # 2
Георг
Электрический пёс
 
Аватар для Георг
 
Регистрация: 25.08.2002
Адрес: Московская подводная Лодка
Сообщения: 4 414

Георг ГипербогГеорг ГипербогГеорг ГипербогГеорг ГипербогГеорг ГипербогГеорг Гипербог
Георг ГипербогГеорг ГипербогГеорг ГипербогГеорг ГипербогГеорг ГипербогГеорг ГипербогГеорг ГипербогГеорг ГипербогГеорг ГипербогГеорг ГипербогГеорг ГипербогГеорг ГипербогГеорг ГипербогГеорг ГипербогГеорг ГипербогГеорг Гипербог
Перенёс.
__________________
Если хочешь иметь то, чего никогда не имел, то должен делать то, чего никогда не делал...
Георг вне форума  
Старый 13.02.2005, 22:12     # 3
Zaber
Junior Member
 
Аватар для Zaber
 
Регистрация: 19.12.2001
Адрес: Israel
Сообщения: 184

Zaber Путь к славе только начался
Заметил

Начал сам тут воротить книжку
Коннелл Джон Разработка элементов управления Microsoft .NET на Microsoft Visual Basic .NET.pdf
так как читать в таком виде после печати нельзя
прогнал через FR7 ну и ясное дело он серого текста почти не видит
что подскажите ??
пока читаю коректирую но читать в FR не самое приятное
__________________
Хорошему человеку ничего не жалко
Zaber вне форума  
Старый 15.02.2005, 19:32     # 4
renreg
Member
 
Регистрация: 16.02.2002
Сообщения: 346

renreg Луч света в тёмном царствеrenreg Луч света в тёмном царствеrenreg Луч света в тёмном царствеrenreg Луч света в тёмном царствеrenreg Луч света в тёмном царстве
FineReader распознает хорошо (и это понятно), если оригинал сканировался с разрешением 300 dpi. Перераспознай с увеличение разрешения оригинала. Может помочь.
renreg вне форума  
Старый 15.02.2005, 22:54     # 5
Zaber
Junior Member
 
Аватар для Zaber
 
Регистрация: 19.12.2001
Адрес: Israel
Сообщения: 184

Zaber Путь к славе только начался
Проблема в другом
у меня есть книга которая ранее была кем то распознана и скорее всего не очень качественно как результат много слов которые не распознались и сохранились как картинки на светло сером фоне серые буквы
перераспознать этот фаил не удаётся так как фр вообще пропускает эти слова или теряет большую часть слова скорее всего из за контраста

оригинала скана у меня нет
вот и пытаюсь колдовать с тем , что есть
может есть какая то опция увеличить контраст для фн ?
__________________
Хорошему человеку ничего не жалко
Zaber вне форума  
Старый 16.02.2005, 07:14     # 6
renreg
Member
 
Регистрация: 16.02.2002
Сообщения: 346

renreg Луч света в тёмном царствеrenreg Луч света в тёмном царствеrenreg Луч света в тёмном царствеrenreg Луч света в тёмном царствеrenreg Луч света в тёмном царстве
Я вижу такой способ:
1. Полным Acrobat'om сохранить PDF как картинки (например, в многостраничный TIFF) с увеличением разрешения до 300 dpi.
2. Перераспознать FineReader'om.

Если на этом этапе увеличить разрешение не удастся, то использовать специальные программы (наизусть не вспомню). Можно и в Photoshop, но я не знаю как там делать автоматом у всех файлов сразу.

Ни пуха, ни пера
renreg вне форума  
Старый 16.02.2005, 10:26     # 7
topknot
Junior Member
 
Регистрация: 25.09.2004
Адрес: ніжин
Сообщения: 128

topknot Известность не заставит себя ждатьtopknot Известность не заставит себя ждать
Ещё есть такая штука как ABBYY PDF Transformer, можно попробовать.
topknot вне форума  
Старый 16.02.2005, 11:10     # 8
renreg
Member
 
Регистрация: 16.02.2002
Сообщения: 346

renreg Луч света в тёмном царствеrenreg Луч света в тёмном царствеrenreg Луч света в тёмном царствеrenreg Луч света в тёмном царствеrenreg Луч света в тёмном царстве
Цитата:
Сообщение от topknot
Ещё есть такая штука как ABBYY PDF Transformer, можно попробовать.
Ты его устанавливал? Это, на мой взгляд, урезанная версия FineReader
renreg вне форума  
Старый 17.02.2005, 18:59     # 9
Zaber
Junior Member
 
Аватар для Zaber
 
Регистрация: 19.12.2001
Адрес: Israel
Сообщения: 184

Zaber Путь к славе только начался
трансформер не думаю что поможет , это тот же финереадер
__________________
Хорошему человеку ничего не жалко
Zaber вне форума  
Старый 17.02.2005, 20:14     # 10
Goryn
::VIP::
 
Аватар для Goryn
 
Регистрация: 06.03.2003
Адрес: DZ, LBP, Moscow
Пол: Male
Сообщения: 633

Goryn Имеются все основания чтобы гордиться собойGoryn Имеются все основания чтобы гордиться собойGoryn Имеются все основания чтобы гордиться собойGoryn Имеются все основания чтобы гордиться собойGoryn Имеются все основания чтобы гордиться собойGoryn Имеются все основания чтобы гордиться собойGoryn Имеются все основания чтобы гордиться собойGoryn Имеются все основания чтобы гордиться собойGoryn Имеются все основания чтобы гордиться собой
Я когда-то делал форматирование для печати книжки с помощью макроса для Word. Но при формировании страниц нарушалось расположение рисунков, таблиц и т.д.
Но для форматирования просто текста - подходит.

Если надо - могу порытся в архивах.
__________________
Меня многие спрашивают, как я живу с тремя головами... На самом деле, я триедин, как Великие Бобы!
Goryn вне форума  
Старый 17.02.2005, 21:53     # 11
Zaber
Junior Member
 
Аватар для Zaber
 
Регистрация: 19.12.2001
Адрес: Israel
Сообщения: 184

Zaber Путь к славе только начался
Goryn , проблема не в форматирование, а в распозновании текста
макрос не помешает для коллекции , но это из другой оперы
если напрягает то не исчи так как не горит.
Попробывал решить вопрос с распознованием так :
сохранил страницу из ФР в серый тифф без компресии
через ФотоШоп поигрался с настройками и поднял контраст изображения
НО результат не впечатляет вообще распознать так и не смог .
Вывод : проблема в начертании букв ,а не в их цвете ( контрасте ).
решения этой проблемы у меня нет , только пересканировать книгу

2RenReg : не смог сохранить с повышенным DPI , не нашёл такой настройки в FR7Pro, подскажи где она .

Вот наверно и всё по этому вопросу
п.с. возможно всё таки кто-то знает как это решить , тогда
__________________
Хорошему человеку ничего не жалко
Zaber вне форума  
Старый 18.02.2005, 11:19     # 12
renreg
Member
 
Регистрация: 16.02.2002
Сообщения: 346

renreg Луч света в тёмном царствеrenreg Луч света в тёмном царствеrenreg Луч света в тёмном царствеrenreg Луч света в тёмном царствеrenreg Луч света в тёмном царстве
Цитата:
Сообщение от Zaber
RenReg : не смог сохранить с повышенным DPI , не нашёл такой настройки в FR7Pro, подскажи где она
При распознавании FineReader дожен тебя предупреждать. Какая у тебя версия FineReader?

Может ты ghiktim мне нераспознанный текст - я поиграюсь. Мыло - в профиле.
Или выложи куда-нибудь
renreg вне форума  
Старый 18.02.2005, 13:13     # 13
CEO
Full Member
 
Аватар для CEO
 
Регистрация: 31.08.2003
Адрес: где-то между Марсом и Юпитером
Сообщения: 998

CEO Имеются все основания чтобы гордиться собойCEO Имеются все основания чтобы гордиться собойCEO Имеются все основания чтобы гордиться собойCEO Имеются все основания чтобы гордиться собойCEO Имеются все основания чтобы гордиться собойCEO Имеются все основания чтобы гордиться собойCEO Имеются все основания чтобы гордиться собойCEO Имеются все основания чтобы гордиться собойCEO Имеются все основания чтобы гордиться собойCEO Имеются все основания чтобы гордиться собойCEO Имеются все основания чтобы гордиться собой
Цитата:
Zaber:2RenReg : не смог сохранить с повышенным DPI , не нашёл такой настройки в FR7Pro, подскажи где она .
Думаю что даже если бы и смог, толку никакого не было бы. Сканировать надо было с большим разрешением. Что касается распознования, есть ведь не только файнридер. Попробуй OCR CuneiForm 2000 .
http://lib.csu.ru/dl/bases/prg/kompr...Test/index.htm -- здесь написано, что он хорошо справляется при работе с так называемыми плохими текстами: факсами, ксерокопиями, текстами, отпечатанными на пишущей машинке или матричном принтере, документами, отсканированными в низком разрешении...
__________________
Старые игры раздают здесь
CEO вне форума  
Старый 19.02.2005, 23:25     # 14
Zaber
Junior Member
 
Аватар для Zaber
 
Регистрация: 19.12.2001
Адрес: Israel
Сообщения: 184

Zaber Путь к славе только начался
Ну что я скажу попробовал OCR CuneiForm 2000 результат не впечатляет
во первых при распозновании просит задать язык однозначно , а текст на 2-х языках это раз
во вторых даже русский текст распознал хуже ФР

2renreg фаил занимает 20 метров архива , тебе не в тягость качать ?
смотри лм
__________________
Хорошему человеку ничего не жалко
Zaber вне форума  


Ваши права в разделе
Вы НЕ можете создавать новые темы
Вы не можете отвечать в темах.
Вы НЕ можете прикреплять вложения
Вы НЕ можете редактировать свои сообщения

BB код Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.

Быстрый переход


Часовой пояс GMT +4, время: 02:58.




Powered by vBulletin® Version 3.8.5
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.