如何用python爬虫获取被js修饰过的网页Elements

右击“查看网页源代码”和f12的Elements不一样。

如果直接用urllib.request.urlopen('...')然后read()的话只能得到网页源代码，即原始的html，未被js加工，并不是我所需要的Elements。

今天查了一整天，也一直在尝试，一直无法得解。

我不能用xpath的方法，因为xpath本事也是需要手动去找的，而我的需求是：从搜索页面中获得一系列网页的url，并从其中获取数段文字，这些文字也只有在Elements中才有。这些网页的网址没有规律，不能用for i in range的方法获取。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
NYTWTYN 2022-02-14 09:02
关注
可以先将原始的 html 保存成字符内容，然后用正则表达式匹配获取对应的内容。

解决 1

无用 2
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python爬虫笔记
2024-03-01 23:47

齐飞的博客 python爬虫笔记
python中获取网页元素
2021-09-06 14:43

Klein.Blue的博客 python中获取网页元素一、方法概括 xml/html文本：正则表达式re、xpath json文件：jsonpath模块、正则表达式re 二、通用方法使用所有方法获取页面元素都是需要先请求获取数据(爬虫)，对返回数据进行分析，...
Python爬虫开发学习全教程第二版，爆肝十万字【建议收藏】
2021-10-17 13:35

五包辣条！的博客大家好，我是辣条。...网络爬虫（又被称为网页蜘蛛，网络机器人）就是模拟客户端(主要指浏览器)发送网络请求，接收请求响应，一种按照一定的规则，自动地抓取互联网信息的程序。原则上,只要是客户端(浏
elements与网页源代码_零基础学 Python爬虫（8）：网页基础
2020-12-20 23:32

weixin_39679678的博客人生苦短，我用 Python先赞后看是个好习惯网页的组成我们的数据来源是网页，那么我们在真正抓取数据之前，有必要先了解一下一个网页的组成。网页是由 HTML 、 CSS 、JavaScript 组成的。HTML 是用来搭建整个网页的...
Python爬虫自学笔记（二）静态网页爬取
2021-09-09 12:56

阿尔法羊的博客 Beautiful Soup 是 python 的一个库，最主要的功能是从网页抓取数据。 Beautiful Soup 提供一些简单的、python 式的函数用来处理导航、搜索、修改分析树等功能。它是一个工具箱，通过解析文档为用户提供需要抓取的...
python爬虫学习日志使用selenium爬取动态网页数据
2023-03-30 14:53

栀子枝头盛的博客对此，我们如果想要获取网页中会更新的内容，只依赖requests库是获取不到相应数据的，这里我们就可以使用selenium来帮助我们获取网页数据。Selenium是一种用于测试Web应用程序的自动化工具，支持多种浏览器和多种...
Python爬虫
2025-07-10 22:55

1115cr的博客本文介绍Python开发网络爬虫的基本流程，包括发起请求、获取响应内容、解析内容和保存数据。
(6)python爬虫--selenium
2025-05-19 14:39

码有余悸的博客 selenium 不仅简化了 Web 自动化测试的流程，还为数据采集和动态网页交互提供了强大的...借助 Python 的灵活性和 Selenium 的丰富功能，开发者能够高效地完成复杂的任务，无论是自动化测试、爬虫开发，还是网页监控。
Python爬虫基础笔记【自用】
2025-02-05 12:47

JianShi0828的博客 table：表格，tr：行，td...也可理解为使用程序模拟浏览器，去向服务器发送请求，获取响应信息爬取网页：爬取整个网页，包含了网页中所有得内容解析数据：将网页中你得到的数据进行解析难点：爬虫和反爬虫之间的博弈。
笔记-Python爬虫技术基础及爬取百度新闻
2024-10-13 10:23

galaxy‘的博客笔记-Python爬虫技术基础及爬取百度新闻
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 2月13日

如何用python爬虫获取被js修饰过的网页Elements

2条回答 默认 最新

问题事件

2条回答默认最新