Rico100723 2022-08-17 17:07 采纳率: 100%
浏览 59
已结题

python爬虫爬取网页代码遇到了一些问题

python爬虫爬取网页源码,返回结果是网页源代码,而我要元素里的代码,因为我需要的东西源代码没有

先分享一下代码和运行结果:

img

img

我最终需要的是这个网址

img

也就是这个元素代码

img

但是它返回的是源代码,与元素不同,所以我之后用beautifulsoup爬不到这个网址

img

img

(大家可以以那个html注释 “flash播放控件” 来定位代码哦)

这个问题我遇到已经很久了,我搜了好长时间也没找到比较好的解决方法(或是看不懂),请各位懂得帮忙指点一下,谢谢( ̄︶ ̄*))

  • 写回答

3条回答 默认 最新

  • honestman_ 2022-08-17 17:39
    关注

    因为元素里的你要的内容是通过 ajax 请求动态加载的,可以浏览器抓包去看下,你想要的这条数据到底是哪个请求返回的,找到真正的请求,然后模拟发送就行了

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

问题事件

  • 系统已结题 8月25日
  • 已采纳回答 8月17日
  • 创建了问题 8月17日

悬赏问题

  • ¥15 metadata提取的PDF元数据,如何转换为一个Excel
  • ¥15 关于arduino编程toCharArray()函数的使用
  • ¥100 vc++混合CEF采用CLR方式编译报错
  • ¥15 coze 的插件输入飞书多维表格 app_token 后一直显示错误,如何解决?
  • ¥15 vite+vue3+plyr播放本地public文件夹下视频无法加载
  • ¥15 c#逐行读取txt文本,但是每一行里面数据之间空格数量不同
  • ¥50 如何openEuler 22.03上安装配置drbd
  • ¥20 ING91680C BLE5.3 芯片怎么实现串口收发数据
  • ¥15 无线连接树莓派,无法执行update,如何解决?(相关搜索:软件下载)
  • ¥15 Windows11, backspace, enter, space键失灵