python在post请求下爬取数据，返回的值为什么为空？

本人小白，尝试爬杭州市二手房挂牌信息，
网址：http://jjhygl.hzfc.gov.cn/webty/gpfy/gpfySelectlist.jsp，
代码如下

import requests
url = 'http://jjhygl.hzfc.gov.cn/webty/WebFyAction_getGpxxSelectList.jspx'
data = {'page': 1}
headers = {'Host': 'jjhygl.hzfc.gov.cn',
            'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:68.0) Gecko/20100101 Firefox/68.0',
            'Accept': 'text/html, */*; q=0.01',
            'Accept-Language': 'en-US,en;q=0.5',
            'Accept-Encoding': 'gzip, deflate',
            'Content-Type': 'application/x-www-form-urlencoded; charset=UTF-8',
            'X-Requested-With': 'XMLHttpRequest',
            'Content-Length': '311',
            'Connection': 'keep-alive',
            'Referer': 'http://jjhygl.hzfc.gov.cn/webty/gpfy/gpfySelectlist.jsp',
            'Cookie': 'ROUTEID=.lb6; JSESSIONID=2E78A1FE8DBC80F1CEEE20264BE96B1F.lb6; Hm_lvt_70e93e4ca4be30a221d21f76bb9dbdfa=1559115557; Hm_lpvt_70e93e4ca4be30a221d21f76bb9dbdfa=1559115557',
            'Pragma': 'no-cache',
            'Cache-Control': 'no-cache'}
r = requests.post(url, data =data, headers = headers)
r.content
r.text

返回结果是

b'{"list":[],"pageinfo":"\xe6\x9a\x82\xe6\x97\xa0\xe6\x95\xb0\xe6\x8d\xae"}'
'{"list":[],"pageinfo":"暂无数据"}'

请问怎么才能得到图中的信息？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

6条回答

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
战渣渣 2019-05-30 09:15
关注
是因为你给的数据不足够，我刚才打开你的网站试了一下。

header中必须有以下数据

body中必须与以下数据

结果如你所愿

综合来看，你还是对于网站的分析不太够，header中的cookie以及body中的那几个参数应该是请求[http://jjhygl.hzfc.gov.cn/webty/gpfy/gpfySelectlist.jsp]的时候获得。所以需要先请求拿过来参数，第二步再请求这个地址。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 2
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(5条)

报告相同问题？

关注问题

python在post请求下爬取数据，返回的值为什么为空？ python
2019-05-29 17:34

回答 6 已采纳是因为你给的数据不足够，我刚才打开你的网站试了一下。 # header中必须有以下数据 ![图片说明](https://img-ask.csdn.net/upload/201905/30/1559
python 爬虫 post请求返回的数据不全，和postman模拟的不一样，关键内容是个空列表 python 有问必答爬虫
2021-09-08 11:50

回答 2 已采纳经过实际测试，该站对 refer和 origin 没有验证，却验证了 content-type，你在header里加上content-type就可以了 import requests impor
Python requests.post方法爬取携程酒店获取不到数据 python
2021-07-28 11:42

回答 3 已采纳我猜请求头里面一定有数据是动态变化的，并且要做验证，你得知道它是如何加密的那些数据~
基于Python的Post请求数据爬取的方法详解
2020-09-19 07:17

主要介绍了基于Python的Post请求数据爬取的方法,需要的朋友可以参考下
python爬虫抓数据，反馈请求成功，但是数据不对，这是为什么 python 爬虫
2022-07-20 16:02

回答 2 已采纳你确定你传的这两个参数能返回出有值的data？
python request 库POST请求从ajax爬取数据遇到formdata不会处理了 ajax python 爬虫
2018-06-11 02:48

回答 2 已采纳刚看了一下你的代码：改了一下，我加了查询日期，6月1日到6月11的。其他字段自己加上就行了： import requests url = "http://www.ccgp-shaa
python爬虫request后返回值为空 chrome python 有问必答爬虫
2022-01-27 16:25

回答 2 已采纳接口需要post请求并发送数据，题主get请求没用改下面就可以了，注意不能采集太快，有防火墙会拦截。。-_-||。。。 import requests import time headers =
python爬取网页数据+json数据处理+post请求处理-spider.py
2020-08-18 11:21

python3代码，包含了处理post请求爬取网页数据代码，注释部分包括对json数据的处理。如果有疑问，随时扣me *-*
python爬取36kr时模拟Post请求返回的内容不是需要的内容 html5 json python
2020-07-27 09:23

回答 4 已采纳 HTTP Status 500所以肯定什么地方错了我用网页打开也是500，所以你再看看接口的必要元素是不是少了
python爬取ashx页面的post请求 python
2018-03-18 06:59

回答 2 已采纳这个网站有多一层东西，你可以这么干。先请求http://www.lzggzyjy.cn/InfoPage/InfoList.aspx?SiteItem=8 然后用正则找到然后请求这个/aja
用python requests.post（）实现翻页，表单上传后返回数据缺失 python 有问必答
2021-11-27 19:50

回答 1 已采纳 1.需要传cookies参数,2.data数据的即字典的值都要写成字符串。获取json后再从中用bs4解析出数据。参考如下代码： import requests cookies = { 'P
Python爬取网页数据，为什么返回为空？
2022-01-12 14:40

baidu_17201253的博客我在测试时使用最新浏览器的版本号，也是返回空） import urllib.request,re headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/82.0.4051.0 Safari...
python爬虫请求数据加密怎么破解？？？ python
2021-03-04 22:33

回答 3 已采纳页面地址 http://tool.liumingye.cn/music/?page=searchPage 脚本里有个encode函数，是这么加密的。如果要爬取的话用selenium比较适
python爬取数据步骤_基于Python的Post请求数据爬取的方法详解
2020-11-28 14:16

weixin_39590472的博客为什么做这个和同学聊天，他想爬取一个网站的post请求观察该网站的post请求参数有两种类型：（1）参数体放在了query中，即url拼接参数（2）body中要加入一个空的json对象，关于为什么要加入空的json对象，猜测原因为...
python获取post请求并解析_基于Python的Post请求数据爬取的方法详解
2021-01-13 04:35

weixin_39912163的博客为什么做这个和同学聊天，他想爬取一个网站的post请求观察该网站的post请求参数有两种类型：(1)参数体放在了query中，即url拼接参数(2)body中要加入一个空的json对象，关于为什么要加入空的json对象，猜测原因为反...
没有解决我的问题, 去提问

悬赏问题

¥15 八爪鱼爬数据为什么自己停了
¥15 交替优化波束形成和ris反射角使保密速率最大化
¥15 树莓派与pix飞控通信
¥15 自动转发微信群信息到另外一个微信群
¥15 outlook无法配置成功
¥30 这是哪个作者做的宝宝起名网站
¥60 版本过低apk如何修改可以兼容新的安卓系统
¥25 由IPR导致的DRIVER_POWER_STATE_FAILURE蓝屏
¥50 有数据，怎么建立模型求影响全要素生产率的因素
¥50 有数据，怎么用matlab求全要素生产率

python在post请求下爬取数据，返回的值为什么为空？

6条回答

header中必须有以下数据

body中必须与以下数据

结果如你所愿

悬赏问题