Frozennnn 2021-09-08 11:50 采纳率: 50%
浏览 590
已结题

python 爬虫 post请求返回的数据不全,和postman模拟的不一样,关键内容是个空列表

本人小白用爬虫爬取辽宁省政府招标信息的代码如下:


import requests
import datetime
agent = "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.159 Safari/537.36"
head={
    "User-Agent":agent,
    }
url = "http://www.ccgp-liaoning.gov.cn/portalindex.do"
params = {
    "method": "getPubInfoList",
    "t_k": None,
    }
data = {  
    "current": 1,
    "rowCount": 10,
    "searchPhrase": None,
    "district": None,
    "releaseDateStart": (datetime.datetime.now() + datetime.timedelta(days=-60)).strftime('%Y-%m-%d'),
    "releaseDateEnd": datetime.datetime.now().strftime('%Y-%m-%d'),
    "infoTypeCode": 1001,
    "year": None,
    "title": "柴油",
    "privateOrCity": 1,
        }
try:
    response = requests.post(url, params=params, data=data, headers=head, timeout=10)
    print(response.text)

返回结果为,rows中没有数据


{"current":1,"rowCount":10,"rows":[],"total":0}

用postman模拟相同参数请返回有数据

img

img

尝试过headers中加入Cookie,然而并没有用

  • 写回答

2条回答 默认 最新

  • CSDN专家-文盲老顾 2021-09-08 12:52
    关注

    经过实际测试,该站对 refer和 origin 没有验证,却验证了 content-type,你在header里加上content-type就可以了

    
    
    
    import requests
    import datetime
    agent = "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.159 Safari/537.36"
    head={
        "User-Agent":agent,
        "content-type":'application/x-www-form-urlencoded; charset=UTF-8'
        }
    url = "http://www.ccgp-liaoning.gov.cn/portalindex.do?method=getPubInfoList&t_k=null"
    params = {
        "method": "getPubInfoList",
        "t_k": None,
        }
    data = {  
        "current": 1,
        "rowCount": 10,
        "searchPhrase": '',
        "district": '',
        "releaseDateStart": '',
        "releaseDateEnd":'',
        "infoTypeCode": 1001,
        "year": '',
        "title": "柴油",
        "privateOrCity": 1,
        }
    try:
        response = requests.post(url, params=params, data=data, headers=head, timeout=10)
        print(response.text)
    except:
        print('err')
    
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 9月16日
  • 已采纳回答 9月8日
  • 创建了问题 9月8日

悬赏问题

  • ¥15 metadata提取的PDF元数据,如何转换为一个Excel
  • ¥15 关于arduino编程toCharArray()函数的使用
  • ¥100 vc++混合CEF采用CLR方式编译报错
  • ¥15 coze 的插件输入飞书多维表格 app_token 后一直显示错误,如何解决?
  • ¥15 vite+vue3+plyr播放本地public文件夹下视频无法加载
  • ¥15 c#逐行读取txt文本,但是每一行里面数据之间空格数量不同
  • ¥50 如何openEuler 22.03上安装配置drbd
  • ¥20 ING91680C BLE5.3 芯片怎么实现串口收发数据
  • ¥15 无线连接树莓派,无法执行update,如何解决?(相关搜索:软件下载)
  • ¥15 Windows11, backspace, enter, space键失灵