爬虫request返回和浏览器元素不一样

python爬虫小学生，这边看了爬数据，然后就实操一下。
想爬双色球历史期数
地址：https://www.zhcw.com/kjxx/ssq/kjxq/?kjData=2023084
为啥浏览器上的元素和pycharm的request的数据不一样，导致没有办法xpath到红球信息

这边是需要怎么操作捏捏

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN-Ada助手 CSDN-AI 官方账号 2023-07-26 04:10
关注
不知道你这个问题是否已经解决, 如果还没有解决的话:
你可以参考下这个问题的回答, 看看是否对你有帮助, 链接: https://ask.csdn.net/questions/7662576
我还给你找了一篇非常好的博客，你可以看看是否有帮助，链接：Python爬虫之批量爬取B站视频封面（内含爬虫概念理解、requests、xpath初级教学及爬虫遇反爬和内容乱码的解决手段）
除此之外, 这篇博客: python爬取豆瓣高分书籍信息（request+xpath）中的 看看爬取的数据文件 部分也许能够解决你的问题。
以下回答由chatgpt基于相关博客总结生成:
问题截图：问题截图

问题分析：从截图可以看到，通过浏览器查看的页面元素和使用requests获取的数据不一样。这可能是因为网页使用了JavaScript来动态加载内容，而requests只能获取网页的静态内容。

解决方案：要解决这个问题，可以使用一个模拟浏览器行为的工具，比如Selenium。Selenium能够启动一个真实的浏览器，模拟用户的操作并获取完整的页面内容。

以下是解决该问题的步骤：

步骤1：安装Selenium库在PyCharm中，打开终端，并执行以下命令来安装Selenium库：

pip install selenium

步骤2：安装浏览器驱动程序 Selenium需要与浏览器进行交互，所以你需要安装相应的浏览器驱动程序。这里以Chrome浏览器为例，你可以根据自己的需要选择其他浏览器。

首先检查你的Chrome浏览器的版本，然后从ChromeDriver官网下载对应版本的驱动程序。下载地址：ChromeDriver下载地址

下载完成后，将驱动程序添加到系统的PATH环境变量中。

步骤3：使用Selenium模拟浏览器操作在你的Python脚本中，导入Selenium库并创建一个WebDriver对象。然后使用该对象来模拟浏览器的行为，加载页面并获取完整的页面内容。

下面是示例代码：

from selenium import webdriver # 创建一个Chrome浏览器的WebDriver对象 driver = webdriver.Chrome() # 加载页面 url = "https://www.zhcw.com/kjxx/ssq/kjxq/?kjData=2023084" driver.get(url) # 获取完整的页面内容 page_source = driver.page_source # 打印页面内容 print(page_source) # 关闭浏览器 driver.quit()

上述代码中，首先导入了webdriver模块，并创建了一个Chrome浏览器的WebDriver对象。然后使用get()方法加载网页，并使用page_source属性获取了完整的页面内容。最后关闭了浏览器。

你可以根据自己的需求对页面进行进一步的处理，比如使用XPath提取所需的红球信息。

注意：使用Selenium需要谨慎使用，避免给服务器带来不必要的负载。在实际的爬虫应用中，可以先尝试使用requests库获取静态页面内容，如果无法获取到所需的数据，则可以考虑使用Selenium进行模拟操作。

希望上述解决方案能对你有所帮助！如果还有其它问题，请随时向我提问。

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

python爬虫之request库的使用（友好版）
2023-05-23 17:26

i鲸落i的博客 Requests库的使用方式与urllib库类似，但更加简单和灵活。Requests库支持HTTPS请求，并且可以自动处理cookies...自动处理cookies和会话：Requests库可以自动处理cookies和会话，使得在处理Web服务器时更加方便和安全。
python爬虫-请求参数和返回结果AES加密案例：某土地交易网
2024-07-19 14:14

FMSW的博客以上就是这个网站的全部内容了，这个案例比较简单，大家有不懂的欢迎留言讨论。
爬虫入门与requests库的使用——python爬虫
2025-04-19 15:40

freejackman的博客本文介绍了关于浏览器抓包和python爬虫的一些基础知识，详细地讲解了python爬虫中的重要第三方库——requests库的基础使用与进阶使用
requests和scrapy请求同样的页面接口，返回的数据不一样问题
2022-07-18 23:14

码农螺丝钉的博客 requests和scrapy请求同样的页面接口，返回的数据不一样问题；实际是cookie要求传参的格式不一样
后端领域爬虫在电商平台竞品数据采集中的策略
2025-07-08 23:26

大厂资深架构师的博客竞争对手的新款手机定价...这时候，后端爬虫就成了"自动收集数据的小助手"，它能模拟人类浏览网页的行为，批量抓取所需信息，为竞品分析提供数据支撑。本文的范围是：聚焦后端爬虫技术在电商竞品数据采集中的核心策略。
2024 python 求职常见面试题（北京爬虫/后端）
2021-11-15 19:14

JHC0000abc的博客 python 优缺点开源，可移植，支持面向过程和面向对象，可扩展性，可嵌入性，库多慢用c重写重要部分，GIL python程序运行过程 ...断言可以在条件不满足程序运行的情况下直接返回错误，而不必等待
Python爬虫遇到Request-Payload怎么办？
2019-08-08 16:08

谁偷了我的小鱼干儿的博客最近想用 Python 自动地爬取某个站点里的图片，没想到其请求数据是以request payload格式传输给后端进行处理的。博主还是第一次遇到这种情况，写下这篇文章记录一下解决过程。博主浏览器使用的是 Chrome，下文说...
Python爬虫：浏览器模拟解决反爬，JS逆向解决反爬
2024-10-25 17:57

阳%的博客接下来我们要对网站内部进行相应的修改，就是把刚开始不一样的产品id进行修改，以便获取更多的信息：(同样是设定函数)（1）我们看：顶图是原本点击图标的详细信息，而点击页面的网址变化与信息内的一些指标是有关系...
Python爬虫开发学习全教程第二版，爆肝十万字【建议收藏】
2021-10-17 13:35

五包辣条！的博客大家好，我是辣条。...网络爬虫（又被称为网页蜘蛛，网络机器人）就是模拟客户端(主要指浏览器)发送网络请求，接收请求响应，一种按照一定的规则，自动地抓取互联网信息的程序。原则上,只要是客户端(浏
Python requests库(爬虫和接口测试)
2022-08-15 19:51

度假的小鱼的博客 Python requests库(爬虫和接口测试),爬个网站的图片保存到本地
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 8月3日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 7月26日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月26日

爬虫request返回和浏览器元素不一样

3条回答 默认 最新

问题事件

3条回答默认最新