Возникла необходимость перегнать несколько документов из формата PDF в вордовский DOC.
Под эти цели нашел утилиту Xilisoft PDF to Word Converter. Скачал, опробовал. То ли я чего-то не понял, то ли это не совсем то, что мне нужно. Я рассчитывал нормально вынуть текст, а получил набор картинок с вкраплениями текстовых блоков. Работать с полученным на выходе файлом попросту неудобно.
В общем, сижу и думаю. То ли приноравливаться к тому, что есть. То ли продолжить «э-э-э-эксперименты»…
Может, кто сталкивался с подобной задачей?
UPD: Да, FineReader то. что надо. Спасибо!
Оригинал записи находится в моем блоге на dreamwidth.org. Комментировать можно и там, и здесь.
На NNM-club выложили "Будет ласковый дождь" в HD, скан с киноплёнки. Без реставрации, но картинка…
29 мая мне прилетело извещение, что на одной из страниц сайта есть контент, нарушающий авторские…
Оказывается, Булычёв "Осечку-67" не совсем нафантазировал. В ноябре 1967-го "Аврора" действительно покинула место стоянки, чтобы…
В детство впадаю. В одной группе ВКонтакте заговорили про диафильмы, разворошили ностальгию. Конечно, покупать фильмоскоп…
Друзья, подписчики! Всё понимаю - лето, отпуска. Но без вашей поддержки сайту не выжить, особенно…
С утра отправился в поход за хабаром. То бишь, за жизненно необходимыми препаратами. Четыре упаковки…
This website uses cookies.
View Comments
Finereader'ом.
+1
Видишь ли, есть два формата пдф - с текстом и в виде картинок. Судя по всему тебе попался именно второй, его можно только распознать программой типа FineReader. А из обычного, тектового пдф вытащить гораздо проще, была программка, но я сейчас не помню чем пользовался, а найти не могу.
Угу.
Из текстового пдф я обычно просто выделяю мышом и копирую (по частям, если много страниц). А из картинного - только через FineReader.
Какой пдф - сразу понятно, если мышом поводить. Если выделяется по буквам - то текстовый, если прямоугольные области безотносительно содержимого - то картинный.