Форум русскоязычного сообщества Ubuntu


Хотите сделать посильный вклад в развитие Ubuntu и русскоязычного сообщества?
Помогите нам с документацией!

Автор Тема: Как выдрать текст из pdf-файла?  (Прочитано 1580 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн mstdmstd

  • Автор темы
  • Активист
  • *
  • Сообщений: 322
    • Просмотр профиля
Подскажите, нет ли возможности в Kubuntu 18 используя
Okular, Version 1.3.3 (или какую другую програмку) выдрать текст из  pdf-файла?
Не уверен но похоже что содержание пдф-файла представляет из себя отдельную картинку .  Можно ли это проверить...

Спасибо!

Оффлайн andytux

  • Заслуженный пользователь
  • Старожил
  • *
  • Сообщений: 6834
    • Просмотр профиля
Re: Как выдрать текст из pdf-файла?
« Ответ #1 : 09 Мая 2019, 17:53:31 »
Цитировать
выдрать текст из  pdf-файла?
Рядом лень глянуть.

Оффлайн zg_nico

  • Заслуженный пользователь
  • Почётный модератор
  • Старожил
  • *
  • Сообщений: 3513
  • Nil mortalibus arduum est
    • Просмотр профиля
Re: Как выдрать текст из pdf-файла?
« Ответ #2 : 09 Мая 2019, 17:56:46 »
нет ли возможности в Kubuntu
В Kubuntu возможность есть. Проблема только в том, что степень возможности применения этой возможности напрямую зависит от самого файла, - есть в нем текстовый слой, или нет. В меню "Сервис" Okular есть инструмент - "Выделение текста". Если Вы им по документу водите, а текст не выделяется, значит перед Вами не текстовый слой, а картинка. В этом случае только выполнять распознавание текста - иного пути нет. Сам этим никогда не занимался, - вот пример обсуждения из предыдущих тем. Сам я в простейшем случае предпочитаю документ от руки перенабрать - быстрее и точнее получается, чем доверять "распознавалкам"...
Thunderobot G150-D2: Intel SkyLake Core i7-6700HQ 2.60GHz, 8Gb DDR4 2133 MHz, Intel HD530, NVidia GeForce GTX 960M 2Gb.  Ubuntu 16.04 64x [Unity], KUbuntu 18.04 64x.

Оффлайн ALiEN

  • Администратор
  • Старожил
  • *
  • Сообщений: 6690
  • 20% Cooler
    • Просмотр профиля
Re: Как выдрать текст из pdf-файла?
« Ответ #3 : 09 Мая 2019, 20:37:09 »
выдрать текст из  pdf-файла?
загружаете в  google drive, редактируете в google docs. Даже картинки распознаёт. Минусом - может слететь форматирование.
🖥 AsRock B550M Pro4 :: AMD Ryzen 5 3600 :: 16 GB DDR4 :: AMD Radeon RX 6600 :: XFCE
💻 ACER 5750G :: Intel Core i5-2450M :: 6 GB DDR3 :: GeForce GT 630M :: XFCE

 

Страница сгенерирована за 0.055 секунд. Запросов: 25.