沸腾の鱼 2022-02-13 21:40 采纳率: 71.4%
浏览 110

如何用python爬虫获取被js修饰过的网页Elements

右击“查看网页源代码”和f12的Elements不一样。

如果直接用urllib.request.urlopen('...')然后read()的话只能得到网页源代码,即原始的html,未被js加工,并不是我所需要的Elements。

今天查了一整天,也一直在尝试,一直无法得解。

我不能用xpath的方法,因为xpath本事也是需要手动去找的,而我的需求是:从搜索页面中获得一系列网页的url,并从其中获取数段文字,这些文字也只有在Elements中才有。这些网页的网址没有规律,不能用for i in range的方法获取。

  • 写回答

2条回答 默认 最新

  • NYTWTYN 2022-02-14 09:02
    关注

    可以先将原始的 html 保存成字符内容,然后用正则表达式匹配获取对应的内容。

    评论

报告相同问题?

问题事件

  • 创建了问题 2月13日

悬赏问题

  • ¥30 STM32 INMP441无法读取数据
  • ¥100 求汇川机器人IRCB300控制器和示教器同版本升级固件文件升级包
  • ¥15 用visualstudio2022创建vue项目后无法启动
  • ¥15 x趋于0时tanx-sinx极限可以拆开算吗
  • ¥500 把面具戴到人脸上,请大家贡献智慧
  • ¥15 任意一个散点图自己下载其js脚本文件并做成独立的案例页面,不要作在线的,要离线状态。
  • ¥15 各位 帮我看看如何写代码,打出来的图形要和如下图呈现的一样,急
  • ¥30 c#打开word开启修订并实时显示批注
  • ¥15 如何解决ldsc的这条报错/index error
  • ¥15 VS2022+WDK驱动开发环境