![]() |
PDF в TXT?
Можно ли и как переформатировать формат документа PDF в обычный текстовой формат?
|
Можно. Один чувак провернул это, так его компания Adobe чуть не засудила. Тебе это надо? Незащищенный PDF можно открыть в Adobe Acrobat и выдрать оттуда все, что пожелаешь. Иначе - амба.
Мне, помнится, приходилось заниматься следующим геморроем: PDF открывался в Acrobat Reader'е и каждая страница сохранялась как jpg-файл; потом вся стопка картинок распознавалась в FineReader'е и переносилась в Word, где окончательно форматировалась. |
Shosh, спасибо!
Дело в том, что есть прога Image2PDF, которая конвертирует любое изображение и отсканированный текст в PDF-документы и не требует Adode Acrobat. Думал, что можно обойтись без FineReader для распознавания текста. |
Ghost, извини за ошибку в твоем нике, бывает!
|
А чем плох copy -> paste???
|
... есть прога которая PDF конвертирует в обычный HTML, а оттуда уж можно и TXT сделать :dance:
|
Finereader 6 открывает pdf и не сильно напрягаясь распознаёт и сохраняет в любой текстовый файл, проверенно на практике.
|
Timoha
Да есть такая прога , но косяк в том что с русским у неё проблемы ,не умеет она это делать с русским текстом (а хотелось бы) так что достойного решения нет , кроме того , что сказал Ghost . Так что ему голос я накинул :) и пошёл искать нужную софтину . |
to Bizon
Finereader 6 открывает pdf и не сильно напрягаясь распознаёт и сохраняет в любой текстовый файл... Как????????? Все облазил - ничего не нашел. |
Вложений: 2
wk-cof
Файл --> Открыть изображение... Прикрепил скриншоты |
_http://www.solidpdf.com/ - Работает с русским идеально. Pdf -> rtf, doc, txt, html
Цитата:
естессно). Правда, с русским работает кривовато. |
Не всякий русский текст из Акробате можно скопировать напрямую. От кодировок шрифта, которым он создан, зависит. Так что способ с Файн Ридером -- самый надежный, хоть и не самый простой.
|
Есть еще один вариант:
PDF to Word 1.4 _HTTP://www.softodrom.ru/win/ap/p4228.shtml |
Можно, но слишком сложно для поставленной задачи. ;-))
|
PDF2TXT.v3.1 - конвертирует текстовые файлы из формата PDF в TXT. Поддерживает PDF файлы создаваемые Acrobat 7.0, работает из командной строки, через drag'n'drop, позволяет конвертировать даже битые PDF'ы.
[urlо]httр://[сцылка покоцана модератором]cti-p2tx.zip.html[/urlо] |
/удивленно/ И русский язык нормально переводит??? :) Могу прислать такой PDF, который не прожуёт.
|
Цитата:
|
| Часовой пояс GMT +4, время: 04:56. |
Powered by vBulletin® Version 3.8.5
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.