Categories: Блог

PDF в DOC

Возникла необходимость перегнать несколько документов из формата PDF в вордовский DOC.
Под эти цели нашел утилиту Xilisoft PDF to Word Converter. Скачал, опробовал. То ли я чего-то не понял, то ли это не совсем то, что мне нужно. Я рассчитывал нормально вынуть текст, а получил набор картинок с вкраплениями текстовых блоков. Работать с полученным на выходе файлом попросту неудобно.
В общем, сижу и думаю. То ли приноравливаться к тому, что есть. То ли продолжить “э-э-э-эксперименты”…
Может, кто сталкивался с подобной задачей?
UPD: Да, FineReader то. что надо. Спасибо!

Оригинал записи находится в моем блоге на dreamwidth.org. Комментировать можно и там, и здесь.

Don_Ald

Родился, еще не женился, пока не помер.

View Comments

  • Видишь ли, есть два формата пдф - с текстом и в виде картинок. Судя по всему тебе попался именно второй, его можно только распознать программой типа FineReader. А из обычного, тектового пдф вытащить гораздо проще, была программка, но я сейчас не помню чем пользовался, а найти не могу.

    • Угу.
      Из текстового пдф я обычно просто выделяю мышом и копирую (по частям, если много страниц). А из картинного - только через FineReader.

      Какой пдф - сразу понятно, если мышом поводить. Если выделяется по буквам - то текстовый, если прямоугольные области безотносительно содержимого - то картинный.

Recent Posts

Тыкила – это сила!

Молодец, Татьяна! Не всякая тридцатилетняя выглядит так, как Татьяна в свои семьдесят с хвостиком! Сразу…

3 дня ago

Проба нового формата

Придумалось несколько коллажей. (далее…)

4 дня ago

Ракурсы – день рождения Ленина

Прогулялся немного, поснимал, порассказывал. Премьера в 20 часов.

1 неделя ago

Славкина квартира

Очередная проверка памяти. Грешен, люблю заходить на сайт ЦИАН, смотреть, что почём в центре продаётся.…

1 неделя ago

This website uses cookies.