Форум русскоязычного сообщества Ubuntu


Считаете, что Ubuntu недостаточно дружелюбна к новичкам?
Помогите создать новое Руководство для новичков!

Автор Тема: Извлечение файлов  (Прочитано 4752 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн RIS

  • Автор темы
  • Активист
  • *
  • Сообщений: 303
    • Просмотр профиля
Извлечение файлов
« : 21 Март 2019, 20:03:14 »
Привет, есть папка со 100 000 файлов в формате "eml" без расширения, указанные файлы содержат файлы "xlsx", можно с помощью терминала извлекать файлы "xlsx" в отдельной папки? Спасибо.

Оффлайн RIS

  • Автор темы
  • Активист
  • *
  • Сообщений: 303
    • Просмотр профиля
Re: Извлечение файлов
« Ответ #1 : 21 Март 2019, 20:38:45 »
Вы хотите пример файла xlsx?

Оффлайн piyavking

  • Активист
  • *
  • Сообщений: 709
  • никогда так не было, чтобы никак не было
    • Просмотр профиля
    • Пиявкин
Re: Извлечение файлов
« Ответ #2 : 21 Март 2019, 21:06:49 »
имеет смысл либо поискать консольный почтовый клиент, который умеет в eml, и подбирать ключи запуска для извлечения вложений, ну а дальше сваять bash скрипт.


можно ещё попробовать парсить eml файлы напрямую регулярными выражениями (если синтаксис eml файлов позволяет такое делать).
крайний LTS Netboot, awesomeWM/иксы без WM, urxvtd, qutebrowser, vim/gvim, mpv/smplayer, linux-lowlatency, jack+wineasio

Оффлайн Vitsliputsli

  • Старожил
  • *
  • Сообщений: 1293
    • Просмотр профиля
Re: Извлечение файлов
« Ответ #3 : 22 Март 2019, 16:36:06 »

Оффлайн RIS

  • Автор темы
  • Активист
  • *
  • Сообщений: 303
    • Просмотр профиля
Re: Извлечение файлов
« Ответ #4 : 22 Март 2019, 19:01:01 »
Спасибо за программу.
Кажется что так munpack 1.eml не будет работать если у меня в папке 100 000 файлов в формате eml без расширения.

Оффлайн Vitsliputsli

  • Старожил
  • *
  • Сообщений: 1293
    • Просмотр профиля
Re: Извлечение файлов
« Ответ #5 : 22 Март 2019, 21:27:56 »
А если так:
munpack *?
Но многое зависит от того, что хотите получить, и что у вас в директории.

Оффлайн RIS

  • Автор темы
  • Активист
  • *
  • Сообщений: 303
    • Просмотр профиля
Re: Извлечение файлов
« Ответ #6 : 22 Март 2019, 22:02:04 »
У меня в папке 100 000 файлов в формате eml без расширения в которых среди других есть приложения в формате xlsx, мне нужно извлекать все приложения из eml, первично интересуют xlsx.

Оффлайн Vitsliputsli

  • Старожил
  • *
  • Сообщений: 1293
    • Просмотр профиля
Re: Извлечение файлов
« Ответ #7 : 22 Март 2019, 22:36:48 »
В чем сейчас сложность? Программа работает? Извлекает? Не знаете как автоматизировать для множества файлов?

Оффлайн RIS

  • Автор темы
  • Активист
  • *
  • Сообщений: 303
    • Просмотр профиля
Re: Извлечение файлов
« Ответ #8 : 23 Март 2019, 00:16:39 »
В папку "Downloads" скопировал файлы в формате "eml" с названием по маске "1553174980460000".
Запустил команду "munpack *" в "Терминале", но получаю результат "Did not find anything to unpack from Downloads"

Оффлайн ALiEN175

  • Модератор форума
  • Старожил
  • *
  • Сообщений: 4716
  • Capture the truth
    • Просмотр профиля
Re: Извлечение файлов
« Ответ #9 : 23 Март 2019, 02:55:04 »
RIS,Какая маска 1553174980460000 ??? Зачем?
Скопировали в папку 100 файлов, потестили - дальше запустили 1000, потестили - запускайте всё остальное.

Нужно сначала в правильный каталог перейти, прежде чем запускать команды вида
munpack *
Пользователь добавил сообщение 23 Март 2019, 03:06:26:
Искренне советую не заниматься "самообразованием", а нанять грамотного специалиста.
« Последнее редактирование: 23 Март 2019, 03:12:11 от ALiEN175 »
ASUS P5K-C :: Intel Xeon E5450 :: 8 GB RAM :: Radeon R7 260X :: XFCE
SAMSUNG N150 :: Intel Atom N450 :: 2 GB RAM :: Intel GMA3150 :: XFCE

Оффлайн RIS

  • Автор темы
  • Активист
  • *
  • Сообщений: 303
    • Просмотр профиля
Re: Извлечение файлов
« Ответ #10 : 23 Март 2019, 12:24:01 »
Thunderbird качает письма в формате eml без расширения с названием файла по примеру 1553174980460000.
При запуске munpack * теоретически сканирует все пользовательские папки, ищет eml архивы и извлекает файлы, в этом случае он пишет результат "Did not find anything to unpack from Downloads", при том что в указанной папки есть письма в формате eml без расширения с названием файла по примеру 1553174980460000.
Тогда среди вас есть специалист который может создавать скрипт который решит эту задачу?

Оффлайн ALiEN175

  • Модератор форума
  • Старожил
  • *
  • Сообщений: 4716
  • Capture the truth
    • Просмотр профиля
Re: Извлечение файлов
« Ответ #11 : 23 Март 2019, 12:39:26 »
создавать скрипт который решит эту задачу?
а что создавать? Уважаемый Vitsliputsli уже предложил решение. Я даже у себя потестил - не 81к писем, конечно, но сотенку обрабатывает стабильно.

Пользователь добавил сообщение 23 Март 2019, 12:44:36:
При запуске munpack * теоретически сканирует все пользовательские папки
Теоретически munpack никакие папки не сканирует. Звёздочка, то есть "*" - wildcards, подстановка. Вам нужно либо зайти в папку (команда cd) и выполнить вышеуказанную команду, либо указать полный путь
munpack /long/path/to/folder/*
(Нажмите, чтобы показать/скрыть)
« Последнее редактирование: 23 Март 2019, 12:55:39 от ALiEN175 »
ASUS P5K-C :: Intel Xeon E5450 :: 8 GB RAM :: Radeon R7 260X :: XFCE
SAMSUNG N150 :: Intel Atom N450 :: 2 GB RAM :: Intel GMA3150 :: XFCE

Оффлайн RIS

  • Автор темы
  • Активист
  • *
  • Сообщений: 303
    • Просмотр профиля
Re: Извлечение файлов
« Ответ #12 : 23 Март 2019, 13:22:17 »
1) Запустил в Терминале munpack /home/aik/Downloads/*

2) Результат

tempdesc.txt: File exists
=XUTF-8XBX0JPQvtGC0L7QstC+X9Ci0LjRgtCw0YDQtdC90LrQviDQky7QlC5f0JrQpjcg0LTQtdGC0LDQu9C4X=XXX=XUTF-8XBX0LfQsNGG0LjRjy54bHN4X= (application/vnd.openxmlformats-officedocument.spreadsheetml.sheet)

3) В папке /home/aik/ появились папки и файлы в формате

а)Содержимое папки https://prntscr.com/n1t5ji
б)Содержимое файлов https://prntscr.com/n1t5ln

4) В письмах есть xlsx файлы, эти файла нужно извлекать, а полученные архивы не открываются в Libre office.

Оффлайн Vitsliputsli

  • Старожил
  • *
  • Сообщений: 1293
    • Просмотр профиля
Re: Извлечение файлов
« Ответ #13 : 23 Март 2019, 13:35:57 »
Дайте пример eml, попробуем

Оффлайн RIS

  • Автор темы
  • Активист
  • *
  • Сообщений: 303
    • Просмотр профиля
Re: Извлечение файлов
« Ответ #14 : 23 Март 2019, 13:53:53 »
Архив с тремя письмами в eml формате без расширения http://bit.ly/2CzB2l7

 

Страница сгенерирована за 0.1 секунд. Запросов: 25.