疫情出行政策爬取报错

问题遇到的现象和发生背景

爬取疫情出行政策时通过抓包找到了返回数据的URL 用新页面复制该URL打开报错401
用爬虫访问也是一样

是通过这个URL抓包到数据返回的地址的
http://www.gov.cn/zhuanti/2021yqfkgdzc/index.htm#/

运行结果及报错内容

401

我的解答思路和尝试过的方法

尝试在pram里加入时间戳反爬也做了

我想要达到的结果

可正常获取到返回的数据


import requests
import json
import time
#格林威治时间
times = time.time()
times = int(times)
#now_time = time.strftime("%Y-%m-%d %H:%M:%S", time.gmtime(times))
#now_times = int(now_time)
print(times)
#print(now_time)
#获取疫情出行政策
cov19heades={
"Set-Cookie": "acw_tc=2760778616594257701925311ee694fc8d01ad5bf99a82936af6b477ae0ee0;path=/;HttpOnly;Max-Age=1800",
"Accept": "t??/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-？？change;v=b3;q=0.9",
"Content-Type": "application/json",
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/103.0.0.0 Safari/537.36"

}
covurl= "http://bmfw.www.gov.cn/bjww/interface/interfaceJson"

parm = {
  "appId": "NcApplication",
  "paasHeader": "zdww",
  "timestampHeader": times,
  "nonceHeader": "123456789abcdefg",
  "signatureHeader": "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx",
  "code": "120000",
  "key": "6C3C60DC1BF54982A54D5A8CB4D1817D"
}
print(parm)
def cov19():
    cov = requests.post(covurl,parm,cov19heades)
    cov.encoding='utf-8'
    print(cov)
    cov.close()
cov19()

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
herosunly 优质创作者: python技术领域 2022-08-04 12:41
关注
亲自运行了下程序，signatureHeader和key是根据ip等信息生成的(典型的反爬，signatureHeader用xxx表示是不行的)，是加密后的。这部分要么逆向解出来，要么只能放弃静态爬虫了，用selenium吧。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

搜狗疫情数据爬取（R语言）
2021-01-20 12:14

趁着周末，来写个爬虫，获取搜狗疫情提供的数据，爬取各个省份以及各个市区的确诊、治愈和死亡数据。 1581827981508.png 网页分析网页地址为：http://sa.sogou.com/new-weball/page/sgs/epidemic?type_page=WEB，...
基于Java的2019nCoV疫情数据爬取与通知系统设计源码
2024-04-17 11:00

本项目是基于Java开发的2019nCoV疫情数据爬取与通知系统设计源码，主要使用Java进行开发。项目共包含36个文件，其中Java源代码文件14个，XML配置文件11个，PNG图片文件2个，Properties配置文件2个，BAK备份文件2个，...
使用python爬取疫情数据
2021-01-21 17:05

实际上这个请求并没有什么反爬取的东西，我们直接爬取就可以了首先就是url url = 'https://c.m.163.com/ug/api/wuhan/app/data/list-total' 为了能够请求成功我们需要一些请求头来把我们伪装成浏览器，其实直接...
python 爬取肺炎疫情.zip
2020-02-08 21:22

在本项目中，我们主要探讨的是如何利用Python编程语言来爬取并可视化肺炎疫情的数据，特别是从163.com的接口获取数据。Python是数据科学领域常用的工具，因其丰富的库和简洁的语法而受到广大开发者的青睐。在这个...
疫情地图爬取第二版
2021-01-21 17:07

网易的数据接口的json格式不断在变化，从2月1日以来变化了三次，今天（2020.02.28）写了一个最新版本。代码如下： import requests import pprint import re import pymysql import time import datetime ...
python自定义天数疫情数据爬取代码
2021-08-15 16:10

使用python爬取每天有关数据，并将数据存入csv文件中，爬取的内容为2021年以来每天各地区的相关信息变化情况。本资源适合新手小白和在校学生，可根据具体需求更改，使用前请务必查看说明文档 #资源达人分享计划#
python 疫情爬取（数据爬取）.zip
2022-07-19 14:01

Python是一种广泛应用于数据分析、网页爬虫、机器学习等领域的高级编程语言。在“python疫情爬取（数据爬取）.zip”这个压缩包文件中，我们可以预见到它包含了一个使用Python进行疫情数据爬取的教程或者项目。对于...
疫情数据爬虫及可视化小组合作项目对丁香园疫情数据进行爬取
2023-10-21 23:13

疫情数据爬虫及可视化小组合作项目对丁香园疫情数据进行爬取，以及使用echarts进行可视化，使用python，flask框架.zip
demo1.py爬取疫情信息所用的模块
2020-07-04 21:37

demo1.py爬取疫情信息所用的模块
Python：爬取疫情每日数据
2020-12-22 08:10

由于疫情已经趋于稳定，所以我不会再更新了，有需要的自己下载 https://download.csdn.net/download/weixin_42029733/12233878 问题2：为什么412？为什么获取不了数据？等等等等 1、这是因为我代码里全国的cookies...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 8月12日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 8月4日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 8月4日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
赞助了问题酬金10元 8月4日
展开全部

疫情出行政策爬取报错

问题遇到的现象和发生背景

运行结果及报错内容

我的解答思路和尝试过的方法

我想要达到的结果

1条回答 默认 最新

问题事件

1条回答默认最新