imho.ws
IMHO.WS  

Вернуться   IMHO.WS > Программы и Операционные системы > Обсуждение программ
Опции темы
Старый 28.05.2003, 21:57     # 1
lesha1974
Junior Member
 
Регистрация: 22.05.2003
Сообщения: 179

lesha1974 Мелкий засранец
Question распознание текста из pdf, ps, djvu - форматов

Часто читаю статьи на английском в формате pdf и ps. И не удобно каждый раз по отдельности переводить и «подписывать» непонятное слово. Точнее подписывать в формате pdf - невозможно (в этом формате документ не редактируется или, во всяком случае, мне не известно с помощью какой программы это можно сделать). Но встретил недавно в интернете возможность переводить из формата pdf в формат djvu. А для редактирования формата pdf у меня есть программа: в ней можно перевод подписать: сделать так, что когда поднесёшь курсор к слову, которое нужно перевести - «выскочит» перевод. Однако это тоже не удобно: переводить и подписывать каждое слово отдельно. Я подумал, что хорошо бы если перевести английский текст из pdf, djvu или ps - форматов текстовый. А потом уже с помощью промта - переводить: у него тоже есть удобная возможность итерактивного первода: выделяешь слово, подносишь к нему курсор - и «выскакивает» перевод.
Но для этого нужен подходящий распознаватель текста. Т.е. распознавалка из формата pdf либо djvu, либо - из ps - форматов.

Как упростить задачу перевода?
Либо как распознать текст либо из pdf либо из djvu, либо - из ps - форматов?
lesha1974 вне форума  
Старый 28.05.2003, 22:20     # 2
YK
Junior Member
 
Регистрация: 02.05.2003
Адрес: страна чудес
Сообщения: 194

YK Путь к славе только начался
ну если есть пакет Adobe Acrobat (не путать с Reader ), то просто открываешь
файл в pdf формате, а затем save us - и выбираешь к примеру .rtf
__________________
Привет от Kadeta
YK вне форума  
Старый 28.05.2003, 22:47     # 3
nick.ddd
Guest
 
Сообщения: n/a

Если не ошибаюсь, FineReader распознает ПэДээФы.
 
Старый 30.05.2003, 08:57     # 4
renreg
Member
 
Регистрация: 16.02.2002
Сообщения: 346

renreg Луч света в тёмном царствеrenreg Луч света в тёмном царствеrenreg Луч света в тёмном царствеrenreg Луч света в тёмном царствеrenreg Луч света в тёмном царстве
nick.ddd
НЕ ошибаешься и очень прилично это делает
renreg вне форума  
Старый 30.05.2003, 13:58     # 5
PrayeR
Faith Saver
Ворчун-2004
 
Аватар для PrayeR
 
Регистрация: 17.12.2002
Адрес: void
Сообщения: 2 583

PrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR Гуру
lesha1974
зачем?!
PromtXT прекрасно переводит pdf!
в самом же акробате!
__________________
я всегда буду против
PrayeR вне форума  
Старый 30.05.2003, 21:40     # 6
lesha1974
Junior Member
 
Регистрация: 22.05.2003
Сообщения: 179

lesha1974 Мелкий засранец
PrayeR

Вот так да! Замечательно!
Однако PromtXT наверно не будет переводить если первоначально текст был не в цифровом, а в графическом формате? Или же он сначала расспознаёт текст, а потом переводит? То есть могут возникнуть ошибки (точнее - не переведённые слова) в связи с неправельным расспознанием?

Ссылку не подскажете?
lesha1974 вне форума  
Старый 31.05.2003, 12:54     # 7
PrayeR
Faith Saver
Ворчун-2004
 
Аватар для PrayeR
 
Регистрация: 17.12.2002
Адрес: void
Сообщения: 2 583

PrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR Гуру
lesha1974
не понял, ты юморишь или нет.. ладно
естественно PromtXT переводит текст, графику он не распознает.
__________________
я всегда буду против
PrayeR вне форума  
Старый 31.05.2003, 12:57     # 8
renreg
Member
 
Регистрация: 16.02.2002
Сообщения: 346

renreg Луч света в тёмном царствеrenreg Луч света в тёмном царствеrenreg Луч света в тёмном царствеrenreg Луч света в тёмном царствеrenreg Луч света в тёмном царстве
PrayeR
Текст до помещения в PDF может быть переведен в "кривые" и помещен в PDF, как графика
renreg вне форума  
Старый 31.05.2003, 13:08     # 9
PrayeR
Faith Saver
Ворчун-2004
 
Аватар для PrayeR
 
Регистрация: 17.12.2002
Адрес: void
Сообщения: 2 583

PrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR Гуру
renreg
ну и...
можно во много чего перевести,
нормально в ПДФ тесткт это текст.
так делают обычно...
все, до свидания.
__________________
я всегда буду против
PrayeR вне форума  
Старый 31.05.2003, 13:28     # 10
renreg
Member
 
Регистрация: 16.02.2002
Сообщения: 346

renreg Луч света в тёмном царствеrenreg Луч света в тёмном царствеrenreg Луч света в тёмном царствеrenreg Луч света в тёмном царствеrenreg Луч света в тёмном царстве
PrayeR
Ты не прав. В некоторых случаях нужно перевести текст в кривые.
Это применяется довольно часто при оформлении в графических программах.
Не будем спорить - кадый работает как ему удобно. Я также встраиваю "текст как текст", но не всем это удоно. Кроме того, люди хотят так защитить свои файлы от возможных изменений.
Видимо с таким случаем и сталкивается lesha1974 . Тут ему поможет только Finereader (или подобная программа).
renreg вне форума  
Старый 31.05.2003, 13:39     # 11
PrayeR
Faith Saver
Ворчун-2004
 
Аватар для PrayeR
 
Регистрация: 17.12.2002
Адрес: void
Сообщения: 2 583

PrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR Гуру
renreg
я прав. потому что текст - по умолчанию. а текст в виде графики - это отдельный случай. и если у него имеено он...
так надо писать про это в вопросе.
чтобы люди не занимались гаданием.

пы.сы. почитай вопрос. еще увидишь нестыковку.
__________________
я всегда буду против
PrayeR вне форума  
Старый 31.05.2003, 13:52     # 12
renreg
Member
 
Регистрация: 16.02.2002
Сообщения: 346

renreg Луч света в тёмном царствеrenreg Луч света в тёмном царствеrenreg Луч света в тёмном царствеrenreg Луч света в тёмном царствеrenreg Луч света в тёмном царстве
PrayeR
Слишком частый "отдельный случай". Так это я знаю что текст может быть таким, а он не знает. Да и нен нужно это человеку. Он хочетьб перевести PDF. Безусловно, PROMT использовать удобно, но если не получается? Вот он и ищет способы.
Я не люблю PROMT - уж очень он стал громоздским. Если приспичит - первожу Сократиком. Если не могу вставить текст, то мне проще пропустить файл через FineReader и затем перевести.

Конечно, самый точный совет можно дать, если видеть исходный файл.
renreg вне форума  
Старый 31.05.2003, 14:18     # 13
PrayeR
Faith Saver
Ворчун-2004
 
Аватар для PrayeR
 
Регистрация: 17.12.2002
Адрес: void
Сообщения: 2 583

PrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR ГуруPrayeR Гуру
renreg
мне по-барабану. я ответил на вопрос ЗАДАННЫЙ.
ему не нравиться или не подходит?
пусть тогда вопрос будет в коректной форме либо не обращает внимания на мой пост.
и если тебе хочется обсуждать такие вещи, то для этого есть приват. у меня нет желания получать нагоняй от модов.
__________________
я всегда буду против
PrayeR вне форума  
Старый 01.06.2003, 21:34     # 14
lesha1974
Junior Member
 
Регистрация: 22.05.2003
Сообщения: 179

lesha1974 Мелкий засранец
Спасибо друзья!
Я очень доволен. Полностью получил ответы которые искал и даже больше.
lesha1974 вне форума  
Старый 19.06.2003, 19:30     # 15
Bazilevs
Guest
 
Сообщения: n/a

Adobe Acrobat умеет сохранять PDF во множестве форматов.
Если сохранение в *.rtf не помогает (причин может быть много:
текст в кривых, вставлен не текст а сканированое изображение и т.д.)
я сохраняю в *.tif без сжатия 300 - 600 dpi. Получаю по одной картинке на страницу. Потом всё это дело просто перетягиваю в Fine Reader и распознаю.
За две недели обработал сидюк с документацией (ок 800 документов от 20 до 200 страниц в каждом).
 
Старый 16.10.2004, 15:37     # 16
organix
Guest
 
Сообщения: n/a

Мне нравится как работает ABBYY PDF Transformer. Не реклама на самом деле часто пользуюсь.
url deleted by Plague (платная )

ABBYY PDF Transformer 1.0 предлагает несколько сценариев быстрого конвертирования PDF–файла в один из редактируемых
форматов (RTF, DOC, TXT, XLS, HTML).
1. Открытие PDF–документов в Microsoft Word и Microsoft Excel для их последующего редактирования.
2. Открытие и конвертирование PDF–файлов из Проводника.
3. Конвертирование PDF–файлов в приложении Microsoft Outlook.
Для большего удобства проведения конвертирования файлов в программе есть Мастер конвертирования ABBYY PDF
Transformer, объединяющий все возможности программы и на каждом этапе подсказывающий, что и как сделать.
Если конвертируемый PDF–документ содержит фрагменты текста на нескольких языках, или вам требуется конвертировать
только выборочные страницы PDF–файла, воспользуйтесь дополнительными настройками программы.
Программа позволяет сохранить исходный файл с полным сохранением оформления всего документа или без сохранения
форматирования (по желанию пользователя).

Последний раз редактировалось Plague; 16.10.2004 в 15:45.
 
Старый 16.10.2004, 15:44     # 17
Plague
Administrator
 
Аватар для Plague
 
Регистрация: 06.05.2003
Адрес: Московская Подводная Лодка
Пол: Male
Сообщения: 12 059

Plague ДемиургPlague ДемиургPlague ДемиургPlague ДемиургPlague ДемиургPlague ДемиургPlague ДемиургPlague ДемиургPlague Демиург
Plague ДемиургPlague ДемиургPlague ДемиургPlague ДемиургPlague ДемиургPlague ДемиургPlague ДемиургPlague ДемиургPlague ДемиургPlague ДемиургPlague ДемиургPlague ДемиургPlague ДемиургPlague ДемиургPlague ДемиургPlague ДемиургPlague ДемиургPlague ДемиургPlague Демиург
organix
правила прочти. ссылки на софт в этом разделе запрещены. максимум - хомпейдж.
__________________
все "спасибы" - в приват и в репутацию! не засоряйте форум!!!!
~~~~~~~~~~~~~~~~~~~~~~

The time has come it is quite clear, our antichrist is almost already here.
M.M.
Plague вне форума  
Старый 11.02.2005, 23:05     # 18
Madchild
Безумный МОД
 
Аватар для Madchild
 
Регистрация: 23.02.2004
Сообщения: 2 640

Madchild Простой бог
Madchild Простой богMadchild Простой богMadchild Простой богMadchild Простой богMadchild Простой богMadchild Простой богMadchild Простой богMadchild Простой богMadchild Простой богMadchild Простой богMadchild Простой богMadchild Простой богMadchild Простой богMadchild Простой богMadchild Простой богMadchild Простой богMadchild Простой бог
Блин, столько тем по PDF... Попробую здесь спросить.

А вот что делать с файлом после распознавания?
Был PDF файл (текст в нем не распознан) - прогнал его через FineReader - надо опять в PDF. Попробовал через Acrobat PDF принтер, но FineReader на каждую страницу ругается, типа размер не подходит. А страниц 60 штук. Пробовал разные параметры распечатки - тоже самое.
Adobe acrobat pro пакет от FineReader'а не воспринимает.
Подскажите, как можно проще обратно пакет в PDF перегнать.
Зы. Пробовал через MS Word - все форматирование слетает...
__________________
...Воистину, вам не придумать себе лучшей маски, чем ваше собственное лицо! Кто может узнать вас?...
Все "спасибо" в приват.
Не засоряйте форум!

Madchild вне форума  
Старый 12.02.2005, 00:18     # 19
renreg
Member
 
Регистрация: 16.02.2002
Сообщения: 346

renreg Луч света в тёмном царствеrenreg Луч света в тёмном царствеrenreg Луч света в тёмном царствеrenreg Луч света в тёмном царствеrenreg Луч света в тёмном царстве
Цитата:
Сообщение от Madchild
Блин, столько тем по PDF... Попробую здесь спросить.

А вот что делать с файлом после распознавания?
Был PDF файл (текст в нем не распознан) - прогнал его через FineReader - надо опять в PDF. Попробовал через Acrobat PDF принтер, но FineReader на каждую страницу ругается, типа размер не подходит. А страниц 60 штук. Пробовал разные параметры распечатки - тоже самое.
Adobe acrobat pro пакет от FineReader'а не воспринимает.
Подскажите, как можно проще обратно пакет в PDF перегнать.
Зы. Пробовал через MS Word - все форматирование слетает...

Ты не мог бы объяснить сначала ЧТО ты делаешь: распознаешь PDF, который потом опять конвертируешь в PDF?
Непонятна твой фраза: "Adobe acrobat pro пакет от FineReader'а не воспринимает"
Объясни свою задачу: ЧТО имеется и ЧТО нужно получить.
renreg вне форума  
Старый 12.02.2005, 00:25     # 20
Madchild
Безумный МОД
 
Аватар для Madchild
 
Регистрация: 23.02.2004
Сообщения: 2 640

Madchild Простой бог
Madchild Простой богMadchild Простой богMadchild Простой богMadchild Простой богMadchild Простой богMadchild Простой богMadchild Простой богMadchild Простой богMadchild Простой богMadchild Простой богMadchild Простой богMadchild Простой богMadchild Простой богMadchild Простой богMadchild Простой богMadchild Простой богMadchild Простой бог
renreg
Есть файл, распознанный в FineReader. Надо его сконвертить в PDF. Через PDF принтер не получается...
__________________
...Воистину, вам не придумать себе лучшей маски, чем ваше собственное лицо! Кто может узнать вас?...
Все "спасибо" в приват.
Не засоряйте форум!

Madchild вне форума  


Ваши права в разделе
Вы НЕ можете создавать новые темы
Вы не можете отвечать в темах.
Вы НЕ можете прикреплять вложения
Вы НЕ можете редактировать свои сообщения

BB код Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.

Быстрый переход


Часовой пояс GMT +4, время: 09:19.




Powered by vBulletin® Version 3.8.5
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.