qq_32236581 2016-01-30 16:24 采纳率: 0%
浏览 1598

python爬虫读不出网站代码的问题

import urllib
import urllib2
page=1
url='http://www.qiushibaike.com/hot/page/'+str(page)
user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'
headers={'User_Agent': user_agent}
try:
request=urllib2.Request(url,headers=headers)
response=urllib2.urlopen(request)
print response.read()
except urllib2.URLError,e:
if hasattr(e,"code"):
print e.code
if hasattr(e,"reason"):
print e.reason

    用了代理还是读不出网页代码
        raise BadStatusLine(line)

BadStatusLine: ''
这是错误提示

  • 写回答

2条回答

  • threenewbee 2016-01-30 23:00
    关注

    你的user agent很老,没有附加cookie,referer等,你的代理是透明代理封掉了你的ip等等都有可能。

    先用浏览器去访问,确保成功,用fiddler抓包,对照写你的程序。

    评论

报告相同问题?

悬赏问题

  • ¥30 这是哪个作者做的宝宝起名网站
  • ¥60 版本过低apk如何修改可以兼容新的安卓系统
  • ¥25 由IPR导致的DRIVER_POWER_STATE_FAILURE蓝屏
  • ¥50 有数据,怎么建立模型求影响全要素生产率的因素
  • ¥50 有数据,怎么用matlab求全要素生产率
  • ¥15 TI的insta-spin例程
  • ¥15 完成下列问题完成下列问题
  • ¥15 C#算法问题, 不知道怎么处理这个数据的转换
  • ¥15 YoloV5 第三方库的版本对照问题
  • ¥15 请完成下列相关问题!