Rico100723 2022-08-17 17:07 采纳率: 100%
浏览 59
已结题

python爬虫爬取网页代码遇到了一些问题

python爬虫爬取网页源码,返回结果是网页源代码,而我要元素里的代码,因为我需要的东西源代码没有

先分享一下代码和运行结果:

img

img

我最终需要的是这个网址

img

也就是这个元素代码

img

但是它返回的是源代码,与元素不同,所以我之后用beautifulsoup爬不到这个网址

img

img

(大家可以以那个html注释 “flash播放控件” 来定位代码哦)

这个问题我遇到已经很久了,我搜了好长时间也没找到比较好的解决方法(或是看不懂),请各位懂得帮忙指点一下,谢谢( ̄︶ ̄*))

  • 写回答

3条回答 默认 最新

  • honestman_ 2022-08-17 17:39
    关注

    因为元素里的你要的内容是通过 ajax 请求动态加载的,可以浏览器抓包去看下,你想要的这条数据到底是哪个请求返回的,找到真正的请求,然后模拟发送就行了

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

问题事件

  • 系统已结题 8月25日
  • 已采纳回答 8月17日
  • 创建了问题 8月17日

悬赏问题

  • ¥15 教务系统账号被盗号如何追溯设备
  • ¥20 delta降尺度方法,未来数据怎么降尺度
  • ¥15 c# 使用NPOI快速将datatable数据导入excel中指定sheet,要求快速高效
  • ¥15 再不同版本的系统上,TCP传输速度不一致
  • ¥15 高德地图点聚合中Marker的位置无法实时更新
  • ¥15 DIFY API Endpoint 问题。
  • ¥20 sub地址DHCP问题
  • ¥15 delta降尺度计算的一些细节,有偿
  • ¥15 Arduino红外遥控代码有问题
  • ¥15 数值计算离散正交多项式