python爬虫读不出网站代码的问题

import urllib
import urllib2
page=1
url='http://www.qiushibaike.com/hot/page/'+str(page)
user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'
headers={'User_Agent': user_agent}
try:
request=urllib2.Request(url,headers=headers)
response=urllib2.urlopen(request)
print response.read()
except urllib2.URLError,e:
if hasattr(e,"code"):
print e.code
if hasattr(e,"reason"):
print e.reason

    用了代理还是读不出网页代码
        raise BadStatusLine(line)

BadStatusLine: ''
这是错误提示

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
threenewbee 2016-01-30 23:00
关注
你的user agent很老，没有附加cookie，referer等，你的代理是透明代理封掉了你的ip等等都有可能。

先用浏览器去访问，确保成功，用fiddler抓包，对照写你的程序。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

写完python爬虫后运行不出结果 python 有问必答爬虫
2022-02-15 05:15

回答 3 已采纳数据是动态从接口获取的，在网页中没有办法直接获取，除非用 selenium模块结合浏览器爬取动态数据 # -*- coding:utf-8 -*- import pandas as pd impor
Python 爬虫代码不报错，也不显示爬取内容 python 有问必答
2021-04-22 11:19

回答 4 已采纳代码逻辑问题，main函数里只有计算耗时的部分，没有调用get_html、parse_html等函数。
python爬图片，代码没报错但是没有结果 python
2022-06-29 05:32

回答 2 已采纳直接运行这个脚本文件的话，图片并不是存在桌面上。而是在这个py文件同目录下，即“C:/Users/AUB/Desktop/Final Year/Python 练习/p54爬虫”
python爬虫（常见爬取失败问题）
2022-02-10 15:17

程序猿-张益达的博客在互联网上进行自动数据采集（抓取）这件事和互联网存在的时间差不多...也许是向服务器提交自认为已经处理得很好的表单却被拒绝，也许是自己的 IP 地址不知道什么原因直接被网站封杀，无法继续访问。原因可能是一.
python爬虫运行无结果 python 爬虫
2021-10-13 19:02

回答 1 已采纳你这个目前只写了一个类，并没有调用，肯定是没有结果的
python爬虫代码运行不报错，但是保存到CSV的数据为空，是哪里出了问题 python
2022-08-09 16:38

回答 8 已采纳 respone.text获取的json数据格式有问题,用 json.loads(respone.text)解析出错另外写csv文件的代码要放到for循环外面,所有数据获取之后再一起写入 cit
Python爬虫针对某网站自动签到思路 python
2019-07-02 22:31

回答 2 已采纳用浏览器f12或者用fiddler抓包，然后再在python里模拟提交
python爬虫运行无结果_详解Python爬虫爬取博客园问题列表所有的问题
2021-02-04 06:27

蓝洱的博客准备工作首先，本文使用的技术为 python+requests+bs4，没有了解过可以先去了解一下。我们的需求是将博客园问题列表中的所有问题的题目爬取下来。二.分析：首先博客园问题列表页面右键点击检查通过Element查找问题所...
python爬虫运行成功但是数据没有输出 python 爬虫
2023-02-24 11:31

回答 8 已采纳选择a标签的时候错误了，应该是 title_tags = tag.select('a')，这样选择每一个a标签，因为 article_tags = soup.select('.docsum-cont
python爬虫使用re.findall(re.compile 筛不出数据！ python 爬虫
2022-09-20 14:01

回答 5 已采纳这是跨行匹配， .*默认是不匹配换行符的，所以匹配不到，确实需要加上re.S： re.findall(re.compile(r'◎译名(.*?)◎', re.S), mainplate_lv2)
关于python爬虫利用正则表达式爬取不到内容的问题 python 数据挖掘机器学习正则表达式
2019-10-18 08:20

回答 3 已采纳爬虫内容解析比较方便的不是正则而是 xpath ，语法也很容易，建议试试这种： ``` from lxml import etree # 解析页面的模块 html = etree.HTML
python爬虫代码运行之后不报错也没有结果_看完！一小时带你入门Python爬虫
2020-12-14 13:03

weixin_39615643的博客一、什么叫爬虫爬虫，又名“网络爬虫”，就是能够自动访问互联网并将网站内容下载下来的程序。它也是搜索引擎的基础，像百度和GOOGLE都是凭借强大的网络爬虫，来检索海量的互联网信息的然后存储到云端，为网友提供...
python 爬虫 requests.get() 所有网页都打不开 python 爬虫
2022-09-24 23:49

回答 1 已采纳 http协议都没加
百度.py python 爬取百度搜索结果，及安全验证问题
2021-11-16 20:12

python 爬取百度搜索结果，及安全验证问题
没有解决我的问题, 去提问

悬赏问题

¥30 这是哪个作者做的宝宝起名网站
¥60 版本过低apk如何修改可以兼容新的安卓系统
¥25 由IPR导致的DRIVER_POWER_STATE_FAILURE蓝屏
¥50 有数据，怎么建立模型求影响全要素生产率的因素
¥50 有数据，怎么用matlab求全要素生产率
¥15 TI的insta-spin例程
¥15 完成下列问题完成下列问题
¥15 C#算法问题, 不知道怎么处理这个数据的转换
¥15 YoloV5 第三方库的版本对照问题
¥15 请完成下列相关问题！