Форум русскоязычного сообщества Ubuntu


Получить помощь и пообщаться с другими пользователями Ubuntu можно
на irc канале #ubuntu-ru в сети Freenode
и в Jabber конференции ubuntu@conference.jabber.ru

Автор Тема: парсер на JavaScript  (Прочитано 1131 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Luca Brasi

  • Автор темы
  • Активист
  • *
  • Сообщений: 706
  • typical engineer
    • Просмотр профиля
парсер на JavaScript
« : 07 Февраля 2015, 23:33:01 »
JS я юзаю сравнительно недаввно и не обозрел все особенности. Хочу следующее: вытягивать инфу из DOM дерева других сайтов. Раньше это делалось на PHP, но теперь информации которую я хочу извлекать в исходном коде нету... Подскажите в какую сторону двигаться, чтобы не очень сложно решить такую задачу.
Ubuntu 18.04/ AMD Ryzen 5 2600 3.4GHz/ MSI B450-A Pro Max / Crucial DDR4-3000 16384MB / MSI PCI-Ex GeForce GT 710 2048 MB / Chieftec GPS-600

Оффлайн alexander.pronin

  • Старожил
  • *
  • Сообщений: 2539
    • Просмотр профиля
Re: парсер на JavaScript
« Ответ #1 : 16 Февраля 2015, 17:09:17 »
Jquery

Оффлайн Luca Brasi

  • Автор темы
  • Активист
  • *
  • Сообщений: 706
  • typical engineer
    • Просмотр профиля
Re: парсер на JavaScript
« Ответ #2 : 16 Февраля 2015, 20:36:10 »
alexander.pronin, я поверхностно знаком с jQuery и полностью представляю как мне вытащить нужный контент. Но это еще не полностью решенная задача. Нужно вытащить его в фоне и запихнуть к себе на сайт. Как то так.
Ubuntu 18.04/ AMD Ryzen 5 2600 3.4GHz/ MSI B450-A Pro Max / Crucial DDR4-3000 16384MB / MSI PCI-Ex GeForce GT 710 2048 MB / Chieftec GPS-600

Оффлайн alexander.pronin

  • Старожил
  • *
  • Сообщений: 2539
    • Просмотр профиля
Re: парсер на JavaScript
« Ответ #3 : 17 Февраля 2015, 10:55:44 »
Тогда лучше питоном.
Хороший удобный парсер - библиотека lxml.
from lxml import etree
Кроме этого есть вариант вариант в стиле jquery для питона. Он сырой, но вполне рабочий.

Оффлайн AnrDaemon

  • Заслуженный пользователь
  • Старожил
  • *
  • Сообщений: 28511
    • Просмотр профиля
Re: парсер на JavaScript
« Ответ #4 : 17 Февраля 2015, 12:09:03 »
С каких пор тут помогают воровать контент?
Хотите получить помощь? Потрудитесь представить запрошенную информацию в полном объёме.

Прежде чем [Отправить], нажми [Просмотр] и прочти собственное сообщение. Сам-то понял, что написал?…

Оффлайн Luca Brasi

  • Автор темы
  • Активист
  • *
  • Сообщений: 706
  • typical engineer
    • Просмотр профиля
Re: парсер на JavaScript
« Ответ #5 : 17 Февраля 2015, 14:11:07 »
почему сразу воровать..?  я ведь не какуюто уникальную инфу собираюсь подтягивать... Да и правообладатель сайта обо всем знает
Ubuntu 18.04/ AMD Ryzen 5 2600 3.4GHz/ MSI B450-A Pro Max / Crucial DDR4-3000 16384MB / MSI PCI-Ex GeForce GT 710 2048 MB / Chieftec GPS-600

Оффлайн alexander.pronin

  • Старожил
  • *
  • Сообщений: 2539
    • Просмотр профиля
Re: парсер на JavaScript
« Ответ #6 : 17 Февраля 2015, 14:25:17 »
Если информация секретная, то ее просто не публикуют. Я так считаю.
Бывает, что пишут, что при копировании надо указывать ссылку на сайт. Это как-то можно понять. Бесплатная реклама.

Оффлайн Luca Brasi

  • Автор темы
  • Активист
  • *
  • Сообщений: 706
  • typical engineer
    • Просмотр профиля
Re: парсер на JavaScript
« Ответ #7 : 17 Февраля 2015, 14:30:22 »
alexander.pronin, согласен. К сожалению я питон не использовал раньше... Он с вебом работает?
Ubuntu 18.04/ AMD Ryzen 5 2600 3.4GHz/ MSI B450-A Pro Max / Crucial DDR4-3000 16384MB / MSI PCI-Ex GeForce GT 710 2048 MB / Chieftec GPS-600

Оффлайн alexander.pronin

  • Старожил
  • *
  • Сообщений: 2539
    • Просмотр профиля
Re: парсер на JavaScript
« Ответ #8 : 17 Февраля 2015, 14:35:01 »
Питон можно использовать везде.
В консольном режиме, на стороне веб-сервера.
На стороне веб-клиента стандартно используется JS.

Оффлайн AnrDaemon

  • Заслуженный пользователь
  • Старожил
  • *
  • Сообщений: 28511
    • Просмотр профиля
Re: парсер на JavaScript
« Ответ #9 : 17 Февраля 2015, 15:13:29 »
почему сразу воровать..?  я ведь не какуюто уникальную инфу собираюсь подтягивать... Да и правообладатель сайта обо всем знает
Потому что если не воровать, то у сайта есть API, через который можно получить всю нужную информацию в удобоваримом виде.
Хотите получить помощь? Потрудитесь представить запрошенную информацию в полном объёме.

Прежде чем [Отправить], нажми [Просмотр] и прочти собственное сообщение. Сам-то понял, что написал?…

Оффлайн Luca Brasi

  • Автор темы
  • Активист
  • *
  • Сообщений: 706
  • typical engineer
    • Просмотр профиля
Re: парсер на JavaScript
« Ответ #10 : 17 Февраля 2015, 15:34:23 »
ну далеко не все сайты имеют эйпиай. Особенно когда речь идет о сайтах созданных ранее, на который публикуются данные расчетов и пр. Да и которые находятся в одной большой локальной сети.
Ubuntu 18.04/ AMD Ryzen 5 2600 3.4GHz/ MSI B450-A Pro Max / Crucial DDR4-3000 16384MB / MSI PCI-Ex GeForce GT 710 2048 MB / Chieftec GPS-600

Оффлайн AnrDaemon

  • Заслуженный пользователь
  • Старожил
  • *
  • Сообщений: 28511
    • Просмотр профиля
Re: парсер на JavaScript
« Ответ #11 : 18 Февраля 2015, 14:41:57 »
"В одной большой локальной сети" вполне можено получить эти рссчёты в чистом виде. Не прибегая к парсингу страниц.
Хотите получить помощь? Потрудитесь представить запрошенную информацию в полном объёме.

Прежде чем [Отправить], нажми [Просмотр] и прочти собственное сообщение. Сам-то понял, что написал?…

Оффлайн Luca Brasi

  • Автор темы
  • Активист
  • *
  • Сообщений: 706
  • typical engineer
    • Просмотр профиля
Re: парсер на JavaScript
« Ответ #12 : 18 Февраля 2015, 16:34:17 »
можно. Но публикуються они на сайте. И пологаю, что этот процесс проще автоматизировать. На сайте эти данные просто обязаны, а выкладывать их в сеть в нужном нам формате никто не будет.
Ubuntu 18.04/ AMD Ryzen 5 2600 3.4GHz/ MSI B450-A Pro Max / Crucial DDR4-3000 16384MB / MSI PCI-Ex GeForce GT 710 2048 MB / Chieftec GPS-600

 

Страница сгенерирована за 0.016 секунд. Запросов: 22.