Python爬虫 requests.post爬取json内容失败

大佬们好，

小弟初来乍到，是个半出家的代码新手，还请多多包涵。

我想通过requests库爬取网站https://ecp.sgcc.com.cn/ecp2.0/portal/#/list/list-spe/2018032600289606_1_2018032700291334，获得相关的标题和链接。通过观察源代码，发现内容是以json格式储存的，初步写出来代码如下。

import requests

url = 'https://ecp.sgcc.com.cn/ecp2.0/ecpwcmcore//index/noteList'
headers = {
'user-agent': 'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.183 Safari/537.36',
'referer': 'https://ecp.sgcc.com.cn/ecp2.0/portal/',
}

# request payload
payload = {
'index': '1'
}

#解析数据
res = requests.post(url,headers=headers,data=payload)
print(res.status_code)
print(res.url)
print(res.text)
note_list_json = res.json()
note_list = note_list_json['resultValue']['noteList']
print(type(note_list))  #<class 'list'>

#提取数据
for i in note_list:
    #标题 title
    title = i['title']
    print(title)
    #发布日期 noticePublishTime
    pub_date = i['noticePublishTime']
    print(pub_date)
    #文件类型 doctype (用于拼接链接)
    doc_type = i['doctype']
    #编码 id (用于拼接链接)
    doc_id = i['id']
    #拼接链接
    link = 'https://ecp.sgcc.com.cn/ecp2.0/portal/#/doc/' + doc_type + '/' + doc_id + '_2018032700291334'
    print(link)
    print('------------------------------')

终端报错结果如下：

回头看一下XHR，发现正常带有数据的内容不一样：报错的是{successful: false}，正常的是{successful: true}。

到这里就卡住了，因为不知道如何成功的获取数据推进到下一步。

如解决问题会私信您VX/ZFB转30元以表心意。希望能够得到帮助，谢谢！

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
bj_0163_bj 2020-12-25 11:17
关注
res = requests.post(url,headers=headers,json=payload)
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 2
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

Python | 爬虫的request.post如何传递json参数
2023-04-17 18:04

科研通天路的博客在Python中的requests库中，使用post()方法发送POST请求，如果需要传递JSON格式的数据，则可以设置请求头Content-Type为"application/json"，并将数据通过json参数传递。
记一次python爬虫requests.post报错405，参数params、data、json用法
2022-04-20 11:44

无名小小卒的博客最近审批太多，需要手动上传，写了个爬虫进行自动上传审批，报错405，原来的代码是这样的 # 请求头 headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko)...
【爬虫】requests.post中data和json参数的使用区别
2024-03-14 16:17

shengchao0920的博客代码： data = {...} ret = requests.post(url, headers=headers, json=data) # 或者 import json data = {...} data = json.dumps(data) ret = requests.post(url, headers=headers, data=data) 总结 form表单格式...
Python requests.post()方法中data和json参数的使用
2022-06-06 23:14

liyinchi1988的博客需要注意的是：python中并没有json类型这一说法，通过json.dumps()转换的字典对象，最后得到的是一个字符串对象，在python中json格式的数据实际上就是一个字符串。虽说json格式的数据在python中是以字符串的类型...
python爬虫：requests发post请求详解
2024-10-26 15:53

小宇python的博客在这个指南中，我们将学习如何使用Python的requests库来调用爱词霸的翻译API，实现英文到中文的翻译功能。
python爬虫案例.rar
2024-03-26 10:15

1. 请求与响应：Python爬虫工作流程通常涉及向服务器发送HTTP请求以获取网页内容，这通过Python的requests库实现。服务器接收到请求后返回HTTP响应，其中包含HTML或其他格式的网页数据。 2. 解析HTML：获取到网页...
两万字博文教你python爬虫requests库详解篇.pdf
2023-05-23 00:54

【Python 爬虫 Requests 库详解】 Requests 是 Python 中广泛使用的 HTTP 客户端库，因其简洁易用而备受青睐。它专为人类设计，是 Python 软件包中最受欢迎的一个，每天的下载量超过 400,000 次。与标准库 urllib ...
Python爬虫资源.pptx
2023-11-21 15:33

Python爬虫是用于自动获取网页内容的程序，它通过HTTP请求获取网页，解析网页内容，提取所需信息，并将其存储在本地或数据库中。爬虫可以定制以实现特定功能，例如数据挖掘、市场分析等。在Python中，有许多库和框架...
python 用 requests发送post请求并获取json数据
2018-06-25 16:54

private风的博客 java进行一次post请求,少说都要洋洋洒洒一两百行代码，创建流，组装参数，发请求，解析数据，关闭流等等而python就只要几行业务代码 #组装参数p["app_id"]="1106571733" p["time_stamp"]=str(time.time()) p[...
Python爬虫项目之爬取头条数据.zip
2024-05-30 05:56

2. **Python爬虫库**：Python中常用的爬虫库有requests和BeautifulSoup。requests用于发送HTTP请求，而BeautifulSoup则用于解析HTML或XML文档。在这个项目中，我们可能会用到这两个库来获取和解析头条新闻的数据。 ...
没有解决我的问题, 去提问

Python爬虫 requests.post爬取json内容失败

3条回答 默认 最新

3条回答默认最新