Форум русскоязычного сообщества Ubuntu


Хотите сделать посильный вклад в развитие Ubuntu и русскоязычного сообщества?
Помогите нам с документацией!

Автор Тема: Как выдрать текст из pdf-файла?  (Прочитано 844 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн mstdmstd

  • Автор темы
  • Активист
  • *
  • Сообщений: 306
    • Просмотр профиля
Подскажите, нет ли возможности в Kubuntu 18 используя
Okular, Version 1.3.3 (или какую другую програмку) выдрать текст из  pdf-файла?
Не уверен но похоже что содержание пдф-файла представляет из себя отдельную картинку .  Можно ли это проверить...

Спасибо!

Оффлайн andytux

  • Старожил
  • *
  • Сообщений: 3906
    • Просмотр профиля
Re: Как выдрать текст из pdf-файла?
« Ответ #1 : 09 Май 2019, 17:53:31 »
Цитировать
выдрать текст из  pdf-файла?
Рядом лень глянуть.

Оффлайн zg_nico

  • Заслуженный пользователь
  • Модератор форума
  • Старожил
  • *
  • Сообщений: 3511
  • Nil mortalibus arduum est
    • Просмотр профиля
Re: Как выдрать текст из pdf-файла?
« Ответ #2 : 09 Май 2019, 17:56:46 »
нет ли возможности в Kubuntu
В Kubuntu возможность есть. Проблема только в том, что степень возможности применения этой возможности напрямую зависит от самого файла, - есть в нем текстовый слой, или нет. В меню "Сервис" Okular есть инструмент - "Выделение текста". Если Вы им по документу водите, а текст не выделяется, значит перед Вами не текстовый слой, а картинка. В этом случае только выполнять распознавание текста - иного пути нет. Сам этим никогда не занимался, - вот пример обсуждения из предыдущих тем. Сам я в простейшем случае предпочитаю документ от руки перенабрать - быстрее и точнее получается, чем доверять "распознавалкам"...
Thunderobot G150-D2: Intel SkyLake Core i7-6700HQ 2.60GHz, 8Gb DDR4 2133 MHz, Intel HD530, NVidia GeForce GTX 960M 2Gb.  Ubuntu 16.04 64x [Unity], KUbuntu 18.04 64x.

Оффлайн ALiEN175

  • Модератор форума
  • Старожил
  • *
  • Сообщений: 4238
  • Capture the truth
    • Просмотр профиля
Re: Как выдрать текст из pdf-файла?
« Ответ #3 : 09 Май 2019, 20:37:09 »
выдрать текст из  pdf-файла?
загружаете в  google drive, редактируете в google docs. Даже картинки распознаёт. Минусом - может слететь форматирование.
ASUS P5K-C :: Intel Xeon E5450 :: 8 GB RAM :: Nvidia 8500GT :: XFCE
SAMSUNG N150 :: Intel Atom N450 :: 2 GB RAM :: Intel GMA3150 :: XFCE

 

Страница сгенерирована за 0.124 секунд. Запросов: 25.