Python爬虫requests反还内容与网页内容不相同

从网络预览可以看到，内容应该是一个列表，使用标头里的请求网址之后，返还的却是一个网页源码，这是为什么呢？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN专家-showbo 2022-03-09 09:00
关注
requests.get得到的是源代码，ajax动态加载或者js动态生成的html代码获取不到，需要直接请求接口获取数据或者从源代码中找到js数据源进行解析。截图中右边块的数据接口为下面这个，直接requests.get请求接口获取数据就行
https://data.stats.gov.cn/easyquery.htm?m=QueryData&dbcode=hgyd&rowcode=zb&colcode=sj&wds=%5B%5D&dfwds=%5B%5D&k1=1646787266750&h=1

示例代码如下

import requests import json import urllib3 url="https://data.stats.gov.cn/easyquery.htm?m=QueryData&dbcode=hgyd&rowcode=zb&colcode=sj&wds=%5B%5D&dfwds=%5B%5D&k1=1646787266750&h=1" requests.packages.urllib3.disable_warnings() res=requests.get(url, verify=False) res.encoding = 'utf8' text=res.text o=json.loads(text) datanodes=o['returndata']['datanodes']#每个月份的数据节点 nodes=o['returndata']['wdnodes'][0]['nodes']#名称数组 for node in nodes: code=node['code'] print(node['name']) nodedata=[item for item in datanodes if item['code'].find('.'+code+'_')!=-1] for data in nodedata: print(data['code'].split('.')[-1],data['data']['data']) print('\n\n\n')

有其他问题可以继续交流~
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决
无用 1
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

Python爬虫实战：抓取与解析网站文本内容
2024-11-18 00:55

内容概要：本文介绍了一个用 Python 实现的爬虫实例，主要分为环境准备、编写基本爬虫代码、高级爬虫（如模拟登录）三个部分。文章详细讲解了如何利用 requests 和 BeautifulSoup4 库进行网页请求与HTML解析，提取所...
Python的网络爬虫与反爬虫策略
2024-12-20 20:51

网络爬虫是一种自动化程序，用于从互联网上抓取、分析和提取数据。它能够模拟浏览器行为，按照设定的规则自动浏览网页并抓取所需信息。...发送请求使用requests库向目标网站发送HTTP请求，获取页面内容。
python爬虫爬网页部分内容空白，但源码可以看到，已解决
2020-12-22 19:08

奇怪的同一个网站同一个榜单，只是页数不同，前若干页能爬取，后若干页就爬取不了，一度怀疑是不允许爬。最后终于发现原因！因为Cookie找错了（kao！！！！！）注意要用这里的cookie！（下图是Chrome的开发者...
Python爬虫：Requests与Beautiful Soup库详解
2025-06-29 22:07

Pu_Nine_9的博客本文介绍了Python爬虫的两个核心库Requests和Beautiful Soup的基本用法
python爬虫requests返回网页内容为空_python爬虫使用requests请求无法获取网页元素时终极解决方案...
2020-11-20 20:55

weixin_39705065的博客原博文2020-06-14 19:28 −爬取数据时，有时候会出现无法通过正常的requests请求获取网页内容，导致数据无法抓取到，遇到这种情况时，可以换种思路去爬取数据，使用PhantomJS，即爬虫终极解决方案去获取页面元素。...
python爬虫的概要介绍与分析
2024-11-22 10:35

此Python爬虫项目旨在抓取特定网站（如BBC新闻）的首页新闻标题和链接，并将其保存到本地文件中。该项目展示了如何使用requests和BeautifulSoup库来抓取网页内容，并提取特定的信息。这是一个基础但功能齐全的爬虫...
【Python爬虫技术】Python爬虫基础教程与案例：涵盖环境搭建、基础实现、案例实战及反爬虫策略
2025-07-16 22:31

内容概要：本文档《Python爬虫基础教程与案例》详细介绍了Python爬虫的基础知识、实现方法及应用案例。首先解释了爬虫的概念及其工作原理，包括发送请求、获取响应、解析内容、存储数据和处理新链接等步骤，并强调了...
Python爬虫入门实例：利用requests和BeautifulSoup抓取网页标题
2024-12-25 10:17

内容概要：本文详细介绍了如何使用Python的requests和BeautifulSoup库构建一个简单的网络爬虫，主要步骤包括发送HTTP请求、解析HTML内容并提取特定的HTML标签。通过实例代码展示，读者可以快速掌握从网站上提取信息...
python中requests爬去网页内容出现乱码问题解决方法介绍
2020-12-25 08:45

最近在学习python爬虫，使用requests的时候遇到了不少的问题，比如说在requests中如何使用cookies进行登录验证，这可以查看这篇文章。这篇博客要解决的问题是如何避免在使用requests的时候出现乱码。 import ...
Python 网页爬虫实例 - 使用 Requests 和 BeautifulSoup 抓取文章标题和链接
2024-10-30 23:13

内容概要：本文介绍了一个用 Python 编写的简单网页爬虫示例。主要涉及使用 requests 库发送 HTTP 请求和使用 BeautifulSoup 库解析 HTML 内容。通过具体的代码示例，演示了如何从一个博客网站抓取文章的标题和链接...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 3月18日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 3月10日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 3月9日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 3月9日
展开全部

Python爬虫requests反还内容与网页内容不相同

2条回答 默认 最新

问题事件

2条回答默认最新