Возникла необходимость перегнать несколько документов из формата PDF в вордовский DOC.
Под эти цели нашел утилиту Xilisoft PDF to Word Converter. Скачал, опробовал. То ли я чего-то не понял, то ли это не совсем то, что мне нужно. Я рассчитывал нормально вынуть текст, а получил набор картинок с вкраплениями текстовых блоков. Работать с полученным на выходе файлом попросту неудобно.
В общем, сижу и думаю. То ли приноравливаться к тому, что есть. То ли продолжить «э-э-э-эксперименты»…
Может, кто сталкивался с подобной задачей?
UPD: Да, FineReader то. что надо. Спасибо!
Оригинал записи находится в моем блоге на dreamwidth.org. Комментировать можно и там, и здесь.
Друзья, подписчики! Без вашей поддержки сайту не выжить. Проект “Don-Ald.ru” – это авторский сайт, где…
Со времени публикации предыдущей статьи про сервис IPTV от Дом.Ру прошло два года, кое-что изменилось…
Со времени публикации предыдущей статьи про сервис IPTV от Дом.Ру прошло два года, кое-что изменилось…
Ладно, уговорили. Вместо колыбельной пара историй из моего далёкого прошлого. Всё со слов матушки моей,…
Ладно, уговорили. Вместо колыбельной пара историй из моего далёкого прошлого. Всё со слов матушки моей,…
This website uses cookies.
View Comments
Finereader'ом.
+1
Видишь ли, есть два формата пдф - с текстом и в виде картинок. Судя по всему тебе попался именно второй, его можно только распознать программой типа FineReader. А из обычного, тектового пдф вытащить гораздо проще, была программка, но я сейчас не помню чем пользовался, а найти не могу.
Угу.
Из текстового пдф я обычно просто выделяю мышом и копирую (по частям, если много страниц). А из картинного - только через FineReader.
Какой пдф - сразу понятно, если мышом поводить. Если выделяется по буквам - то текстовый, если прямоугольные области безотносительно содержимого - то картинный.