Форум русскоязычного сообщества Ubuntu


Считаете, что Ubuntu недостаточно дружелюбна к новичкам?
Помогите создать новое Руководство для новичков!

Автор Тема: Автоматизация рутинных действий в интернете  (Прочитано 540 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн AlekseyUbuntu

  • Автор темы
  • Активист
  • *
  • Сообщений: 399
    • Просмотр профиля
Надо зайти на ~200 веб- страниц и сделать на каждой порядка 50 действий.

Расширение Wildfire (в chrome)- не умеет удалять ненужный текст из полей ввода (вместо замены "текста- подсказки" на нужный она просто добавляет нужный текст в конец).

Расширение Chromium browser automation вообще не работает: вместо  записи моих действий и их повторения создало одно действие по редиректу на нужную мне страницу и даже его не выполняет.

Может есть какие- то GUI- программы под Ubuntu, реализованные не в виде кривых расширений к браузерам, и потому обладающие большей функциональностью и более хорошо проверенные большим сообществом.

Кто что использует для автоматизации графической рутины?
« Последнее редактирование: 17 Марта 2019, 09:09:31 от AlekseyUbuntu »

Оффлайн piyavking

  • Активист
  • *
  • Сообщений: 743
  • никогда так не было, чтобы никак не было
    • Просмотр профиля
    • Пиявкин
Этот функционал, ЕМНИП, полностью делает(/делало?) GreaseMonkey, и справлялось с этим неплохо. Нет возможности проверить - по-моему, оно исчезало из списка аддонов, но возвращалось в источники. И, если greasemonkey пропало - то поискать аналог в области пользовательских скриптов.
крайний LTS Netboot, awesomeWM, urxvtd, firefox, vim/gvim, mpv/smplayer, linux-lowlatency, jack, guitarix, lmms, ardour, mednafen, dsda-doom

Оффлайн zg_nico

  • Заслуженный пользователь
  • Почётный модератор
  • Старожил
  • *
  • Сообщений: 3513
  • Nil mortalibus arduum est
    • Просмотр профиля
AlekseyUbuntu, на работе пользую VBA + Excel + InternetExplorer, иногда чисто InternetExplorer+Javascript. Дома до сих пор обходился Python с bash. Раз пример и два пример. Если действия одинаковые до известной степени - сперва следует набросать словами описание того, что должно быть выполнено автоматически. После - наваять соответствующий скрипт, и проверить его на одной итерации. Далее - получить полный перечень всех итераций (например, список web-адресов, куда следует заходить) и запустить циклический перебор между ними. Возможности самые широкие. Теоретически, можно реализовать абсолютно что угодно.
Thunderobot G150-D2: Intel SkyLake Core i7-6700HQ 2.60GHz, 8Gb DDR4 2133 MHz, Intel HD530, NVidia GeForce GTX 960M 2Gb.  Ubuntu 16.04 64x [Unity], KUbuntu 18.04 64x.

Оффлайн AlekseyUbuntu

  • Автор темы
  • Активист
  • *
  • Сообщений: 399
    • Просмотр профиля
Сейчас решил попробовать связку Python и Selenium:
Современная Веб-Автоматизация при Помощи Python и Selenium
Управляем интернетом с помощью Python]=https://nuancesprog.ru/p/1610/]Управляем интернетом с помощью Python

Пример из первой статьи уже взлетел, а у меня задача не сложнее. Так что будем мастерить руками :)

Оффлайн zg_nico

  • Заслуженный пользователь
  • Почётный модератор
  • Старожил
  • *
  • Сообщений: 3513
  • Nil mortalibus arduum est
    • Просмотр профиля
AlekseyUbuntu, там только с фреймами аккуратнее. Иногда начинаешь разбирать дерево DOM, смотришь на страницу в браузере, видишь там, скажем таблицу. Тыркаешься в this.document.getElementsByTagName('table'), а коллекция пуста. Для меня в свое время откровением стало, что иногда внутри одной страницы живут несколько, запакованные каждая в свой фрейм. Следует проверять их наличие, и обрабатывать соответствующим образом.
Кроме того, бывают случаи, когда данные спарсировать вообще как таковые нельзя в прямом смысле этого слова: веб-страница верстается скриптом прямо на стороне клиента. Однако данные существуют в виде некоего массива, который загружается браузером при старте страницы. Пример такого парсинга (Python) под спойлером, - мало ли будет полезно.
(Нажмите, чтобы показать/скрыть)
И да: руками оно кошернее )) Selenium - хороший выбор. По сути, то же, что я применяю на работе, но с прицелом под Linux.
Thunderobot G150-D2: Intel SkyLake Core i7-6700HQ 2.60GHz, 8Gb DDR4 2133 MHz, Intel HD530, NVidia GeForce GTX 960M 2Gb.  Ubuntu 16.04 64x [Unity], KUbuntu 18.04 64x.

 

Страница сгенерирована за 0.042 секунд. Запросов: 23.