2 younger abc younger_abc 于 2014.05.29 19:33 提问

python beautifulsoup解析wap网页

之前用beautifulsoup解析wap页面很溜的,今天突然不行了,求教这是咋回事。

#!/usr/bin/python

#-*-coding:utf-8-*-
import urllib2
from bs4 import BeautifulSoup

url1 = 'http://www.baidu.com/'
url2 = 'http://wap.baidu.com'
html = urllib2.urlopen(url).read()
c1 = BeautifulSoup(html,from_encoding='utf8')
c2 = c1.title
print c2
#运行url1的时候能解析出Title
#运行url2的时候结果是none
请问这个该咋处理,另外我昨天安装了html5lib,会不会是这个导致的?

1个回答

oyljerry
oyljerry   Ds   Rxr 2015.01.24 17:23

查看页面内容,估计格式有区别。

Csdn user default icon
上传中...
上传图片
插入图片
准确详细的回答,更有利于被提问者采纳,从而获得C币。复制、灌水、广告等回答会被删除,是时候展现真正的技术了!
其他相关推荐
Python 网页解析器BeautifulSoup示例使用
Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式.Beautiful Soup会帮你节省数小时甚至数天的工作时间。 接下来,快事使用一些编程范例,使得尽快熟悉BeautifulSoup使用方法: # coding:utf8 import re from bs4 import Beau
Python 插件杂谈 (4) ---- BeautifulSoup , Python中的网页分析工具
<br />  嗯哼,Meego中文核心站 -- 米趣网 又发新博文啦。<br />     前面向大家介绍了 PyQuery    ,下面转而介绍一下 BeautifulSoup    , Beautiful Soup 是 Python 内置的网页分析工具,名字叫美丽的蝴蝶。呵呵,某些时候确如美丽蝴蝶一样。<br />     先来段介绍:<br />     Beautiful Soup 是一个 Python HTML/XML 处理器,设计用来快速地转换网页抓取。以下的特性支撑着
使用 Beautiful Soup 解析网页内容
安装Beautiful SoupBeautiful Soup是一个Python的HTML解析框架,我们可以利用它方便的处理HTML和XML文档。Beautiful Soup有3和4两个版本,目前3已经停止开发。所以我们当然还是学习最新的Beautiful Soup 4.首先第一件事情就是利用pip安装Beautiful Soup。我们使用下面的命令。pip install beautifulsoup
python学习之BeautifulSoup解析网页
from bs4 import BeautifulSoupimport requestsimport bs4def getHtmlText(url):    try:        r = requests.get(url, timeout = 30)        r.raise_for_status()        r.encoding = r.apparent_encoding      ...
Python获取网页内容、使用BeautifulSoup库分析html
利用 urllib包 获取网页内容#引入包 from urllib.request import urlopenresponse = urlopen("http://fund.eastmoney.com/fund.html") html = response.read();#这个网页编码是gb2312 #print(html.decode("gb2312"))#把html内容保存到一个文件 with
python中使用beautifulsoup4解析网页Html
一、安装 pip install beautifulsoup4 二、四大对象种类 Beautiful Soup将复杂HTML文档转换成一个复杂的树形结构,每个节点都是Python对象,所有对象可以归纳为4种: html = """ <html><head><title>The Dormouse's story</title></head> <body> <p class="title" name="
BeautifulSoup不能完整识别网页html代码
环境:Python版本:2.7.3>>> html = gethtml('http://www.joiway.com/') >>> soup = BeautifulSoup(html) >>> soup.find_all("a",href=True) [] >>> soup.find_all("a") [] >>> soup.find_all("link") [<link href="http://
爬虫解析出来的网页中文部分都是乱码(运用的模块requests, BeautifulSoup)
编码问题起因:解析出来的网页中文部分都是乱码(运用的模块requests, BeautifulSoup)原因:requests出现编码问题(可能)解决办法:html = requests.get(url, headers = header).text改为html = requests.get(url, headers = header).content...
python : BeautifulSoup 网页 table 抓取实例
python BeautifulSoup 网页 table 抓取实例
python : BeautifulSoup 网页 table 解析范例
python BeautifulSoup 网页 table 解析范例