Python爬虫 requests.post爬取json内容失败

大佬们好，

小弟初来乍到，是个半出家的代码新手，还请多多包涵。

我想通过requests库爬取网站https://ecp.sgcc.com.cn/ecp2.0/portal/#/list/list-spe/2018032600289606_1_2018032700291334，获得相关的标题和链接。通过观察源代码，发现内容是以json格式储存的，初步写出来代码如下。

import requests

url = 'https://ecp.sgcc.com.cn/ecp2.0/ecpwcmcore//index/noteList'
headers = {
'user-agent': 'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.183 Safari/537.36',
'referer': 'https://ecp.sgcc.com.cn/ecp2.0/portal/',
}

# request payload
payload = {
'index': '1'
}

#解析数据
res = requests.post(url,headers=headers,data=payload)
print(res.status_code)
print(res.url)
print(res.text)
note_list_json = res.json()
note_list = note_list_json['resultValue']['noteList']
print(type(note_list))  #<class 'list'>

#提取数据
for i in note_list:
    #标题 title
    title = i['title']
    print(title)
    #发布日期 noticePublishTime
    pub_date = i['noticePublishTime']
    print(pub_date)
    #文件类型 doctype (用于拼接链接)
    doc_type = i['doctype']
    #编码 id (用于拼接链接)
    doc_id = i['id']
    #拼接链接
    link = 'https://ecp.sgcc.com.cn/ecp2.0/portal/#/doc/' + doc_type + '/' + doc_id + '_2018032700291334'
    print(link)
    print('------------------------------')

终端报错结果如下：

回头看一下XHR，发现正常带有数据的内容不一样：报错的是{successful: false}，正常的是{successful: true}。

到这里就卡住了，因为不知道如何成功的获取数据推进到下一步。

如解决问题会私信您VX/ZFB转30元以表心意。希望能够得到帮助，谢谢！

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
bj_0163_bj 2020-12-25 11:17
关注
res = requests.post(url,headers=headers,json=payload)
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 2
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

Python爬虫 requests.post爬取json内容失败 ajax html5 json python
2020-12-25 10:40

回答 3 已采纳 res = requests.post(url,headers=headers,json=payload)
Python requests.post方法爬取携程酒店获取不到数据 python
2021-07-28 11:42

回答 3 已采纳我猜请求头里面一定有数据是动态变化的，并且要做验证，你得知道它是如何加密的那些数据~
python 中post请求返回值是500 json python
2022-07-15 17:25

回答 2 已采纳我是把这两个删了就好了'keyfrom': 'fanyi.web','action': 'FY_BY_REALTlME'
python爬虫requests.post()_python爬虫使用requests发送post请求示例详解
2020-11-20 20:56

weixin_39613744的博客简介HTTP协议规定post提交的数据必须放在消息主体中，但是协议并没有规定必须使用什么编码方式。服务端通过是根据请求头中的Content-Type字段来获知请求中的消息主体是用何种方式进行编码，再...application/json 以...
python爬虫中http.client.HTTPSConnection与request的使用 python 有问必答爬虫
2021-12-26 11:25

回答 2 已采纳用它的API啊，这样就省得怕被反爬了 https://docs.opensea.io/reference/api-overview
用PYTHON 的 requests库请求一个post 状态码是200，但是返回内容是空 javascript python 爬虫
2022-07-16 17:00

回答 5 已采纳 body中的data参数是用urlencoded形式传过去的，用urlencode处理一下 import requests from urllib.parse import urlencode i
python 爬虫 post请求返回的数据不全，和postman模拟的不一样，关键内容是个空列表 python 有问必答爬虫
2021-09-08 11:50

回答 2 已采纳经过实际测试，该站对 refer和 origin 没有验证，却验证了 content-type，你在header里加上content-type就可以了 import requests impor
Python | 爬虫的request.post如何传递json参数
2023-04-17 18:04

寒夜点孤灯的博客在Python中的requests库中，使用post()方法发送POST请求，如果需要传递JSON格式的数据，则可以设置请求头Content-Type为"application/json"，并将数据通过json参数传递。
python爬取ashx页面的post请求 python
2018-03-18 06:59

回答 2 已采纳这个网站有多一层东西，你可以这么干。先请求http://www.lzggzyjy.cn/InfoPage/InfoList.aspx?SiteItem=8 然后用正则找到然后请求这个/aja
python爬虫获取内容不全是怎么回事？ python 爬虫
2023-03-01 15:21

回答 2 已采纳你访问的这个接口就只有五千多条数据，您可以在返回的数据中看到，你可以把获取到的数据输出下resp.json()：totalCount': 5860, 'totalPages': 59因此，如果要爬取更
Python爬虫获取到的HTML格式的信息如何转换成json格式 python
2020-07-26 09:08

回答 2 已采纳 json.decoder.JSONDecodeError: Expecting value: line 1 column 1 (char 0) 看看你的编码，是不是不是utf8或者包含了不合法的字符
记一次python爬虫requests.post报错405，参数params、data、json用法
2022-04-20 11:44

无名小小卒的博客最近审批太多，需要手动上传，写了个爬虫进行自动上传审批，报错405，原来的代码是这样的 # 请求头 headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko)...
python爬虫抓数据，反馈请求成功，但是数据不对，这是为什么 python 爬虫
2022-07-20 16:02

回答 2 已采纳你确定你传的这两个参数能返回出有值的data？
Python requests.post()方法中data和json参数的使用
2022-06-06 23:14

liyinchi1988的博客需要注意的是：python中并没有json类型这一说法，通过json.dumps()转换的字典对象，最后得到的是一个字符串对象，在python中json格式的数据实际上就是一个字符串。虽说json格式的数据在python中是以字符串的类型...
python爬虫使用requests发送post请求示例详解
2020-12-17 06:38

简介 HTTP协议规定post提交的数据必须放在...application/json 以json串提交数据。 multipart/form-data 一般使用来上传文件。一、以form表单发送post请求 Reqeusts支持以form表单形式发送post请求，只需要将请求的参
没有解决我的问题, 去提问

悬赏问题

¥15 远程桌面文档内容复制粘贴，格式会变化
¥15 关于#java#的问题：找一份能快速看完mooc视频的代码
¥15 这种微信登录授权谁可以做啊
¥15 请问我该如何添加自己的数据去运行蚁群算法代码
¥20 用HslCommunication 连接欧姆龙 plc有时会连接失败。报异常为“未知错误”
¥15 网络设备配置与管理这个该怎么弄
¥20 机器学习能否像多层线性模型一样处理嵌套数据
¥20 西门子S7-Graph,S7-300，梯形图
¥50 用易语言http 访问不了网页
¥50 safari浏览器fetch提交数据后数据丢失问题

Python爬虫 requests.post爬取json内容失败

3条回答 默认 最新

悬赏问题

3条回答默认最新