Форум русскоязычного сообщества Ubuntu


Увидели сообщение с непонятной ссылкой, спам, непристойность или оскорбление?
Воспользуйтесь ссылкой «Сообщить модератору» рядом с сообщением!

Автор Тема: Python получение исходного кода сайта  (Прочитано 3458 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн RQWERQWER

  • Автор темы
  • Активист
  • *
  • Сообщений: 252
    • Просмотр профиля
Python получение исходного кода сайта
« : 09 Октября 2010, 21:05:20 »
Как можно сделать в Python получение исходного кода сайта? И можно ли потом будет отфильтровать код и оставить только нужное?

Оффлайн Armagidon

  • Новичок
  • *
  • Сообщений: 21
  • Linux the best !
    • Просмотр профиля
Re: Python получение исходного кода сайта
« Ответ #1 : 10 Октября 2010, 14:20:14 »
вот-так

>>> import urllib
>>> c = urllib.urlopen('https://ubuntu.ru').read()
>>> print c
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="ru" lang="ru">
python - best language !

Оффлайн RQWERQWER

  • Автор темы
  • Активист
  • *
  • Сообщений: 252
    • Просмотр профиля
Re: Python получение исходного кода сайта
« Ответ #2 : 10 Октября 2010, 15:55:03 »
вот-так

>>> import urllib
>>> c = urllib.urlopen('https://ubuntu.ru').read()
>>> print c
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="ru" lang="ru">

Спасибо. А как возможно это прикрутить к pyQT? Чтобы выводилось окошко с исходным текстом и кнопкой обновить?

Пользователь решил продолжить мысль 10 Октября 2010, 16:12:02:
И ещё как установить там кодировку? У меня на некоторые сайты неправильно там отображаются.
« Последнее редактирование: 10 Октября 2010, 16:12:02 от ya_vovan »

Оффлайн alexander.pronin

  • Старожил
  • *
  • Сообщений: 2539
    • Просмотр профиля
Re: Python получение исходного кода сайта
« Ответ #3 : 11 Октября 2010, 08:59:02 »
#! /usr/bin/env python
# -*- coding: UTF-8 -*-
print "This is Python"
print "Это питон"

Оффлайн arrecck

  • Старожил
  • *
  • Сообщений: 1725
    • Просмотр профиля
Re: Python получение исходного кода сайта
« Ответ #4 : 11 Октября 2010, 20:45:30 »
тебе легче работать с готовым html движком (webkit, например, или gtkHTML)
для python есть библиотеки

Оффлайн gagarin

  • Любитель
  • *
  • Сообщений: 66
  • whereismymind?
    • Просмотр профиля
Re: Python получение исходного кода сайта
« Ответ #5 : 14 Октября 2010, 23:45:20 »
pyqt4 там есть webkit. инфы очень много.
http://www.riverbankcomputing.co.uk/static/Docs/PyQt4/html/classes.html глянь тут
asus k40ij + ubuntu 10.04

 

Страница сгенерирована за 0.018 секунд. Запросов: 21.