Форум русскоязычного сообщества Ubuntu


Хотите сделать посильный вклад в развитие Ubuntu и русскоязычного сообщества?
Помогите нам с документацией!

Автор Тема: Редактирование PDF  (Прочитано 2265 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Wooten

  • Автор темы
  • Участник
  • *
  • Сообщений: 197
    • Просмотр профиля
Редактирование PDF
« : 11 Февраля 2019, 13:50:38 »
Есть такие пдфки текст которых не копируется. Какой прогой можно сделать доступным копирование?
Нужно для дальнейшей вставки в преобразователь в doc, а потом в переводчик.
Может заодно хороший конвертор пдф в doc посоветуете.

alang

  • Гость
Re: Редактирование PDF
« Ответ #1 : 11 Февраля 2019, 14:21:48 »
Какой прогой можно сделать доступным копирование?

Finereader :)
Если нет текстового слоя, то только распознавать.

Оффлайн Aleksandru

  • Администратор
  • Старожил
  • *
  • Сообщений: 3334
    • Просмотр профиля
Re: Редактирование PDF
« Ответ #2 : 11 Февраля 2019, 17:07:35 »
Я бы посоветовал воспользоваться каким нибудь онлайн конвертером, PDF в Word.
Сейчас уже не помню каким переводил, но результат был весьма неплох.
Под линуксом перевести с форматирование текста, нечем.
Intel Core i5-6400, GeForce GT 1030, ASUS ROG Strix B250G Gaming, 16GB RAM, KINGSTON SV300S37A240G, Digma Mega S3 DGSM3512GS33T 512ГБ.

zse

  • Гость
Re: Редактирование PDF
« Ответ #3 : 11 Февраля 2019, 19:22:43 »
Под линуксом перевести с форматирование текста, нечем.
             Да, почти что так. Но английский текст точно можно с помощью программы:
sudo apt-get install gimagereader-gtk
это графический интерфейс для tesseract или скорее всего для cuneiform.
             С этими двумя программами можно повозиться и в плане кириллицы…
             Но лучший вариант в виртуальной машине это FineReader… Если под виртуальную XP то и 12 версия отлично работает. Очень много распознавал когда работал.
             Но есть люди кто и вот это научился обучать и настраивать https://launchpad.net/cuneiform-linux , говорят получается…
2019 Feb 11; 11:22 AM

Оффлайн garek

  • Новичок
  • *
  • Сообщений: 43
    • Просмотр профиля
Re: Редактирование PDF
« Ответ #4 : 12 Февраля 2019, 10:35:44 »
Есть такие пдфки текст которых не копируется. Какой прогой можно сделать доступным копирование?
1. Как Вам уже сказали выше, копировать возможно только если присутствует текстовый слой, т.е. распознанный с картинки текст, "подложенный" под картинку (или наоборот? не суть).
2. Конвертация в Word тут вообще ни при чем. :idiot2: В лучшем случае конвертер создаст документ Word, в котором просто будет вставлена картинка. :D
3. Для распознавания текста (Оптическое распознавание символов (англ. optical character recognition, OCR)) реально можно использовать только и исключительно FineReader. Все остальные программы, в т.ч. онлайн сервисы — мусор, на который вы потратите время, нервы, но кроме резульнана той или иной степени censored вы ничего не получите. Кстати, если текст не большой, проще пользоваться ScreenshotReader.exe, который идет в комплекте FineReader8.0.0.731. Сам пользуюсь много лет им по работе, просто на ура, Portable версия под вайном.
ЗЫ. И англ., и ру. текс — без разницы.

Цитировать
Правила форума
2. На форуме ЗАПРЕЩЕНО
2.1. Использовать ненормативную лексику в любом виде. В том числе сокращённые и искажённые нецензурные слова. Замена нецензурных слов спецсимволами также не допускается.

 --Aleksandru
« Последнее редактирование: 12 Февраля 2019, 18:10:41 от Aleksandru »
недостаточно дружелюбен к старичкам

Оффлайн Wooten

  • Автор темы
  • Участник
  • *
  • Сообщений: 197
    • Просмотр профиля
Re: Редактирование PDF
« Ответ #5 : 14 Февраля 2019, 05:46:52 »
PDF в Word
много перепробовал. результат неудовлетворительный. пдфный материал это учебные пособия музыкальные,где много нотного текста.Поэтому текст отдельно копировать лучше

zse

  • Гость
Re: Редактирование PDF
« Ответ #6 : 14 Февраля 2019, 06:19:28 »
много нотного текста
             Ну что тут можно посоветовать, коллега Wooten, 😞, это специфическое распознавание, могу только предложить поисковые запросы вроде „program for optical music recognition“ или „OCR for sheet music“…
             Я думаю, что нотами занимались отдельно, так же как штрихкодами или субтитрами, должны беть специальные программы, на музыкальных форумах точно должны знать…
Цитировать
PlayScore takes traditional sheet music scanning to the next level. Using the latest techniques in Optical Music Recognition (OCR for music), PlayScore plays music as it should sound, naturally and smoothly.
             Вот это упоминают часто „надо брать языка😈“ в тех местах где эти языки могут водиться😇!
             2019 Feb 13; 10:19 PM

Оффлайн eyakubovskiy

  • Участник
  • *
  • Сообщений: 131
    • Просмотр профиля
    • https://eyakubovskiy.ru
Re: Редактирование PDF
« Ответ #7 : 14 Февраля 2019, 09:35:54 »
С текстовым слоем в свое время открывал через openoffice и свободно редактировал
Ищущий да обрящет. Имеющий уши да услышит. Зрячий да увидит. Имеющий ум да уразумеет

zse

  • Гость
Re: Редактирование PDF
« Ответ #8 : 14 Февраля 2019, 15:23:41 »
             Коллега Wooten, пришлите пару листов вашего pdf. Я посмотрел тут музыкальные статьи и вижу, что сами ноты оставляют картинкой, а текст распознают.
             Достичь такого результата легко, правда каждый лист потребует ручной обработки в FineReader, это чтобы совсем было красиво.
Цитировать
Нужно для дальнейшей вставки в преобразователь в doc, а потом в переводчик.
             Что в вашем понятии „преобразователь в .doc“? Это конвертор pdf —▶ doc ? Если сделать просто читаемый pdf файл с картинками нотной записи, то текст в переводчик можно будет вставлять из pdf.

             А во вложении типичная страница статьи про музыку, сразу говорю в музыке не понимаю ничего😞…
2019 Feb 14; 07:23 AM

Оффлайн Dixi257

  • Активист
  • *
  • Сообщений: 287
    • Просмотр профиля
Re: Редактирование PDF
« Ответ #9 : 15 Февраля 2019, 00:58:24 »
Супруга много занимается нотами, публикует статьи, сборники. Попытайтесь точнее и подробнее сформулировать задачу, спрошу у неё. Но знаю, что часто ноты она набивает заново от руки, говорит, так быстрее, чем распознавать и править многочисленные ошибки.

 

Страница сгенерирована за 0.063 секунд. Запросов: 25.