Форум русскоязычного сообщества Ubuntu


Автор Тема: Выделение значения из WEB-страницы  (Прочитано 828 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн megafanat

  • Автор темы
  • Новичок
  • *
  • Сообщений: 38
    • Просмотр профиля
Выделение значения из WEB-страницы
« : 25 Декабря 2012, 16:15:09 »
Есть некоторая страница, с определенным URL, содержащая кучу разной информации. Среди прочего страница содержит одно нужное нам значение. Например температуру. Хочется периодически загружать страницу, считывать значение температуры и сохранять его в текстовый файл. Содержимое страницы меняется, но общая структура остается постоянной. Температура всегда находится на одном и том же месте.

Задача осложняется тем, что страница представляет собой файл с расширением asp и он почти не содержит html-кода. По всей видимости он представляет собой исполняемый файл, который формирует страницу. По крайней мере страница открытая в текстовом редакторе совершенно не похожа на то, что отображается в браузере.

В общем подскажите пожалуйста, как можно решить такую задачу? Какие есть средства для выделения небольшого кусочка из WEB-страницы?

Оффлайн ZwS

  • Старожил
  • *
  • Сообщений: 1674
    • Просмотр профиля
Re: Выделение значения из WEB-страницы
« Ответ #1 : 25 Декабря 2012, 16:22:50 »
Код: (bash) [Выделить]
curl http://страница | sed 's/.*\(регулярка для выбора температуры\)/\1/'как то так
Dell Inspiron One 2330 | Intel+Radeon HD7650A | 8GB RAM | Ubuntu GNOME 17.10

Оффлайн megafanat

  • Автор темы
  • Новичок
  • *
  • Сообщений: 38
    • Просмотр профиля
Re: Выделение значения из WEB-страницы
« Ответ #2 : 26 Декабря 2012, 05:12:44 »
А curl может преобразовать страницу из исполняемого кода в HTML, который получается в результате исполнения этого кода?

Оффлайн alexander.pronin

  • Старожил
  • *
  • Сообщений: 2539
    • Просмотр профиля
Re: Выделение значения из WEB-страницы
« Ответ #3 : 26 Декабря 2012, 08:29:15 »
Исполняемый код (кроме JS) выполняется на сервере, а клиенту всегда приходит результат исполнения.
ЗЫ. Проблема в получении исходного кода, выполняемого на сервере (его не получить в принципе), а с результом выполнения  проблем не должно быть.
« Последнее редактирование: 26 Декабря 2012, 08:47:52 от alexander.pronin »

Оффлайн megafanat

  • Автор темы
  • Новичок
  • *
  • Сообщений: 38
    • Просмотр профиля
Re: Выделение значения из WEB-страницы
« Ответ #4 : 27 Декабря 2012, 06:14:09 »
При просмотре в браузере исходного кода страницы в упор не вижу HTML, но зато вижу кучу какого-то исполняемого C-подобного кода. Возможно как раз JS.

Оффлайн ZwS

  • Старожил
  • *
  • Сообщений: 1674
    • Просмотр профиля
Re: Выделение значения из WEB-страницы
« Ответ #5 : 27 Декабря 2012, 15:10:33 »
дай ссылку на страницу, так будет проще разбираться.
Dell Inspiron One 2330 | Intel+Radeon HD7650A | 8GB RAM | Ubuntu GNOME 17.10

Оффлайн megafanat

  • Автор темы
  • Новичок
  • *
  • Сообщений: 38
    • Просмотр профиля
Re: Выделение значения из WEB-страницы
« Ответ #6 : 27 Декабря 2012, 16:34:37 »
Ссылку дать сложно. Это на самом деле страница порождаемая 3G WiFi роутером и является частью его интерфейса.
И мне нужно из него вытаскивать тип сети и уровень сигнала.

Вместо ссылки вложил саму страницу. Можете посмотреть.

Оффлайн alexander.pronin

  • Старожил
  • *
  • Сообщений: 2539
    • Просмотр профиля
Re: Выделение значения из WEB-страницы
« Ответ #7 : 28 Декабря 2012, 08:08:43 »
Не знаю что Вас напугало.
HTML c JS.

Оффлайн AzraelKDE

  • Активист
  • *
  • Сообщений: 773
  • Kubuntu/Xubuntu user
    • Просмотр профиля
Re: Выделение значения из WEB-страницы
« Ответ #8 : 28 Декабря 2012, 08:23:30 »
megafanat, там есть и жаба и HTML, нужное вам значение по видимому содержится в одном из элементов "label", дайте скриншот страницы, с выделением искомого значения, попробую определить в каком именно.
Java + HTML5 = Brain explosion.

Оффлайн absent

  • Активист
  • *
  • Сообщений: 368
  • Ubuntu 16.04
    • Просмотр профиля
Re: Выделение значения из WEB-страницы
« Ответ #9 : 28 Декабря 2012, 08:26:06 »
по-моему, Ваша первая задача - пройти авторизацию на роутер с помощью curl, а потом уже можно думать как снимать показания.

Оффлайн alexander.pronin

  • Старожил
  • *
  • Сообщений: 2539
    • Просмотр профиля
Re: Выделение значения из WEB-страницы
« Ответ #10 : 28 Декабря 2012, 09:50:50 »
по-моему, Ваша первая задача - пройти авторизацию на роутер с помощью curl
Cогласен.
В рассмотрение можно внести еще wget.

 

Страница сгенерирована за 0.05 секунд. Запросов: 25.