Форум русскоязычного сообщества Ubuntu


Увидели сообщение с непонятной ссылкой, спам, непристойность или оскорбление?
Воспользуйтесь ссылкой «Сообщить модератору» рядом с сообщением!

Автор Тема: Редактирование PDF  (Прочитано 1646 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Wooten

  • Автор темы
  • Участник
  • *
  • Сообщений: 148
    • Просмотр профиля
Редактирование PDF
« : 11 Февраль 2019, 13:50:38 »
Есть такие пдфки текст которых не копируется. Какой прогой можно сделать доступным копирование?
Нужно для дальнейшей вставки в преобразователь в doc, а потом в переводчик.
Может заодно хороший конвертор пдф в doc посоветуете.

alang

  • Гость
Re: Редактирование PDF
« Ответ #1 : 11 Февраль 2019, 14:21:48 »
Какой прогой можно сделать доступным копирование?

Finereader :)
Если нет текстового слоя, то только распознавать.

Оффлайн Aleksandru

  • СуперМодератор
  • Старожил
  • *
  • Сообщений: 2655
    • Просмотр профиля
Re: Редактирование PDF
« Ответ #2 : 11 Февраль 2019, 17:07:35 »
Я бы посоветовал воспользоваться каким нибудь онлайн конвертером, PDF в Word.
Сейчас уже не помню каким переводил, но результат был весьма неплох.
Под линуксом перевести с форматирование текста, нечем.
Intel Core i3-3240 3.40GHz, GeForce GT 1030, MSI H61M-P20, 8GB RAM, KINGSTON SV300S37A240G, Kubuntu 20.04

zse

  • Гость
Re: Редактирование PDF
« Ответ #3 : 11 Февраль 2019, 19:22:43 »
Под линуксом перевести с форматирование текста, нечем.
             Да, почти что так. Но английский текст точно можно с помощью программы:
sudo apt-get install gimagereader-gtk
это графический интерфейс для tesseract или скорее всего для cuneiform.
             С этими двумя программами можно повозиться и в плане кириллицы…
             Но лучший вариант в виртуальной машине это FineReader… Если под виртуальную XP то и 12 версия отлично работает. Очень много распознавал когда работал.
             Но есть люди кто и вот это научился обучать и настраивать https://launchpad.net/cuneiform-linux , говорят получается…
2019 Feb 11; 11:22 AM

Оффлайн garek

  • Новичок
  • *
  • Сообщений: 43
    • Просмотр профиля
Re: Редактирование PDF
« Ответ #4 : 12 Февраль 2019, 10:35:44 »
Есть такие пдфки текст которых не копируется. Какой прогой можно сделать доступным копирование?
1. Как Вам уже сказали выше, копировать возможно только если присутствует текстовый слой, т.е. распознанный с картинки текст, "подложенный" под картинку (или наоборот? не суть).
2. Конвертация в Word тут вообще ни при чем. :idiot2: В лучшем случае конвертер создаст документ Word, в котором просто будет вставлена картинка. :D
3. Для распознавания текста (Оптическое распознавание символов (англ. optical character recognition, OCR)) реально можно использовать только и исключительно FineReader. Все остальные программы, в т.ч. онлайн сервисы — мусор, на который вы потратите время, нервы, но кроме резульнана той или иной степени censored вы ничего не получите. Кстати, если текст не большой, проще пользоваться ScreenshotReader.exe, который идет в комплекте FineReader8.0.0.731. Сам пользуюсь много лет им по работе, просто на ура, Portable версия под вайном.
ЗЫ. И англ., и ру. текс — без разницы.

Цитировать
Правила форума
2. На форуме ЗАПРЕЩЕНО
2.1. Использовать ненормативную лексику в любом виде. В том числе сокращённые и искажённые нецензурные слова. Замена нецензурных слов спецсимволами также не допускается.

 --Aleksandru
« Последнее редактирование: 12 Февраль 2019, 18:10:41 от Aleksandru »
недостаточно дружелюбен к старичкам

Оффлайн Wooten

  • Автор темы
  • Участник
  • *
  • Сообщений: 148
    • Просмотр профиля
Re: Редактирование PDF
« Ответ #5 : 14 Февраль 2019, 05:46:52 »
PDF в Word
много перепробовал. результат неудовлетворительный. пдфный материал это учебные пособия музыкальные,где много нотного текста.Поэтому текст отдельно копировать лучше

zse

  • Гость
Re: Редактирование PDF
« Ответ #6 : 14 Февраль 2019, 06:19:28 »
много нотного текста
             Ну что тут можно посоветовать, коллега Wooten, 😞, это специфическое распознавание, могу только предложить поисковые запросы вроде „program for optical music recognition“ или „OCR for sheet music“…
             Я думаю, что нотами занимались отдельно, так же как штрихкодами или субтитрами, должны беть специальные программы, на музыкальных форумах точно должны знать…
Цитировать
PlayScore takes traditional sheet music scanning to the next level. Using the latest techniques in Optical Music Recognition (OCR for music), PlayScore plays music as it should sound, naturally and smoothly.
             Вот это упоминают часто „надо брать языка😈“ в тех местах где эти языки могут водиться😇!
             2019 Feb 13; 10:19 PM

Оффлайн eyakubovskiy

  • Участник
  • *
  • Сообщений: 131
    • Просмотр профиля
    • https://eyakubovskiy.ru
Re: Редактирование PDF
« Ответ #7 : 14 Февраль 2019, 09:35:54 »
С текстовым слоем в свое время открывал через openoffice и свободно редактировал
Ищущий да обрящет. Имеющий уши да услышит. Зрячий да увидит. Имеющий ум да уразумеет

zse

  • Гость
Re: Редактирование PDF
« Ответ #8 : 14 Февраль 2019, 15:23:41 »
             Коллега Wooten, пришлите пару листов вашего pdf. Я посмотрел тут музыкальные статьи и вижу, что сами ноты оставляют картинкой, а текст распознают.
             Достичь такого результата легко, правда каждый лист потребует ручной обработки в FineReader, это чтобы совсем было красиво.
Цитировать
Нужно для дальнейшей вставки в преобразователь в doc, а потом в переводчик.
             Что в вашем понятии „преобразователь в .doc“? Это конвертор pdf —▶ doc ? Если сделать просто читаемый pdf файл с картинками нотной записи, то текст в переводчик можно будет вставлять из pdf.

             А во вложении типичная страница статьи про музыку, сразу говорю в музыке не понимаю ничего😞…
2019 Feb 14; 07:23 AM

Оффлайн Dixi257

  • Активист
  • *
  • Сообщений: 283
    • Просмотр профиля
Re: Редактирование PDF
« Ответ #9 : 15 Февраль 2019, 00:58:24 »
Супруга много занимается нотами, публикует статьи, сборники. Попытайтесь точнее и подробнее сформулировать задачу, спрошу у неё. Но знаю, что часто ноты она набивает заново от руки, говорит, так быстрее, чем распознавать и править многочисленные ошибки.

 

Страница сгенерирована за 0.093 секунд. Запросов: 24.