Форум русскоязычного сообщества Ubuntu


Хотите сделать посильный вклад в развитие Ubuntu и русскоязычного сообщества?
Помогите нам с документацией!

Автор Тема: Отрубить файлу хвост и голову  (Прочитано 814 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн piyavking

  • Автор темы
  • Активист
  • *
  • Сообщений: 743
  • никогда так не было, чтобы никак не было
    • Просмотр профиля
    • Пиявкин
Отрубить файлу хвост и голову
« : 26 Февраля 2013, 03:49:59 »
Есть периодически обновляющийся хтмл-файл с постоянной структурой. Там есть строки

<td colspan="9" class="text"><div style="min-height:333px; height:expression('333px');">

и

<td><br></td>

Строки эти встречаются в файле строго по одному разу, но номера этих строк "плавают". Нужный мне текст находится между этими строками. Подскажите, пожалуйста, как средствами bash вытащить из файла искомый фрагмент. Если можно, поподробнее, мои знания в скриптАх пока оставляют желать лучшего :)

Спасибо за внимание.
« Последнее редактирование: 26 Февраля 2013, 04:11:39 от regenerat »
крайний LTS Netboot, awesomeWM, urxvtd, firefox, vim/gvim, mpv/smplayer, linux-lowlatency, jack, guitarix, lmms, ardour, mednafen, dsda-doom

Глупый_Мо

  • Гость
Re: Отрубить у файла хвост и голову
« Ответ #1 : 26 Февраля 2013, 04:06:16 »
а сам файл можно изменить? Или нужно вытащить в другой файл?

Пользователь решил продолжить мысль 26 Февраля 2013, 04:11:18:
Можно с помощью cat пронумеровать строки, затем через grep узнать каким номерам соответствуют эти строки, затем с помощью sed удалить эти строки. И останется только текст.

Это как вариант. Писать скрипт щас не буду спать хочу.
« Последнее редактирование: 26 Февраля 2013, 04:12:00 от Izamoo »

Оффлайн piyavking

  • Автор темы
  • Активист
  • *
  • Сообщений: 743
  • никогда так не было, чтобы никак не было
    • Просмотр профиля
    • Пиявкин
Re: Отрубить файлу хвост и голову
« Ответ #2 : 26 Февраля 2013, 04:16:02 »
а сам файл можно изменить? Или нужно вытащить в другой файл?

Пользователь решил продолжить мысль 26 Февраля 2013, 04:11:18:
Можно с помощью cat пронумеровать строки, затем через grep узнать каким номерам соответствуют эти строки, затем с помощью sed удалить эти строки. И останется только текст.

Это как вариант. Писать скрипт щас не буду спать хочу.

К сожалению, понимаю весьма смутно. Если, когда проснётесь, поясните поподробнее, буду очень благодарен). К тому же спецсимволы в поисковых шаблонах осложняют задачу.
« Последнее редактирование: 26 Февраля 2013, 04:35:32 от regenerat »
крайний LTS Netboot, awesomeWM, urxvtd, firefox, vim/gvim, mpv/smplayer, linux-lowlatency, jack, guitarix, lmms, ardour, mednafen, dsda-doom

Оффлайн ArcFi

  • Старожил
  • *
  • Сообщений: 15189
    • Просмотр профиля
    • aetera.net
Re: Отрубить файлу хвост и голову
« Ответ #3 : 26 Февраля 2013, 04:50:59 »
awk '/<td colspan="9" class="text"><div style="min-height:333px; height:expression\(.333px.\)/,/<td><br><\/td>/' file.html
$ awk -V
GNU Awk 4.0.1

Оффлайн piyavking

  • Автор темы
  • Активист
  • *
  • Сообщений: 743
  • никогда так не было, чтобы никак не было
    • Просмотр профиля
    • Пиявкин
Re: Отрубить файлу хвост и голову
« Ответ #4 : 26 Февраля 2013, 08:21:23 »
ArcFi,
Уже сам сделал)))

https://forum.ubuntu.ru/index.php?topic=63273.msg1650958#msg1650958

Спасибо за внимание к вопросу, Ваш вариант чотче моей поделки)))
крайний LTS Netboot, awesomeWM, urxvtd, firefox, vim/gvim, mpv/smplayer, linux-lowlatency, jack, guitarix, lmms, ardour, mednafen, dsda-doom

 

Страница сгенерирована за 0.049 секунд. Запросов: 26.