Возникла необходимость перегнать несколько документов из формата PDF в вордовский DOC.
Под эти цели нашел утилиту Xilisoft PDF to Word Converter. Скачал, опробовал. То ли я чего-то не понял, то ли это не совсем то, что мне нужно. Я рассчитывал нормально вынуть текст, а получил набор картинок с вкраплениями текстовых блоков. Работать с полученным на выходе файлом попросту неудобно.
В общем, сижу и думаю. То ли приноравливаться к тому, что есть. То ли продолжить «э-э-э-эксперименты»…
Может, кто сталкивался с подобной задачей?
UPD: Да, FineReader то. что надо. Спасибо!
Оригинал записи находится в моем блоге на dreamwidth.org. Комментировать можно и там, и здесь.
В торрентах появилась экранка фильма "Литвяк" - жуткого качества и с рекламой очередного казино. Смотреть…
Сразу не проверил, но момент зацепил, решил пересмотреть. По сюжету тайная любовь Лёхи рыдает в…
Вчера сподобился полностью отсмотреть первые три серии, претензий очень много. Но вот эта сцена во…
Начал смотреть, сразу же зацепился за этот кадр: Дурачки-реквизиторы притащили кнопочный телефонный аппарат импортного производства.…
Наткнулся в торрентах на новый российский сериал "Радар". Как пишут, снят по мотивам повести Александра…
This website uses cookies.
View Comments
Finereader'ом.
+1
Видишь ли, есть два формата пдф - с текстом и в виде картинок. Судя по всему тебе попался именно второй, его можно только распознать программой типа FineReader. А из обычного, тектового пдф вытащить гораздо проще, была программка, но я сейчас не помню чем пользовался, а найти не могу.
Угу.
Из текстового пдф я обычно просто выделяю мышом и копирую (по частям, если много страниц). А из картинного - только через FineReader.
Какой пдф - сразу понятно, если мышом поводить. Если выделяется по буквам - то текстовый, если прямоугольные области безотносительно содержимого - то картинный.