Rico100723 2022-08-17 17:07 采纳率: 100%
浏览 59
已结题

python爬虫爬取网页代码遇到了一些问题

python爬虫爬取网页源码,返回结果是网页源代码,而我要元素里的代码,因为我需要的东西源代码没有

先分享一下代码和运行结果:

img

img

我最终需要的是这个网址

img

也就是这个元素代码

img

但是它返回的是源代码,与元素不同,所以我之后用beautifulsoup爬不到这个网址

img

img

(大家可以以那个html注释 “flash播放控件” 来定位代码哦)

这个问题我遇到已经很久了,我搜了好长时间也没找到比较好的解决方法(或是看不懂),请各位懂得帮忙指点一下,谢谢( ̄︶ ̄*))

  • 写回答

3条回答 默认 最新

  • honestman_ 2022-08-17 17:39
    关注

    因为元素里的你要的内容是通过 ajax 请求动态加载的,可以浏览器抓包去看下,你想要的这条数据到底是哪个请求返回的,找到真正的请求,然后模拟发送就行了

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

问题事件

  • 系统已结题 8月25日
  • 已采纳回答 8月17日
  • 创建了问题 8月17日

悬赏问题

  • ¥15 paddleocr运行报错
  • ¥15 怎么用 matlab 设计滞后-超前串联校正网络
  • ¥15 MFC引用C#生成的dll,将dll放置到非exe程序目录,如何操作
  • ¥15 C#创建webservice接口,三方通过多次跳转访问本方服务,获取wsdl文档,wsdl中ip地址为局域网内本机地址而非三方直接访问的地址。
  • ¥15 关于#wireshark#的问题:需要安卓app流量数据集要安卓流量做包序列长度的实验,比如某些流量是在看视频还是在发评论
  • ¥15 Smail语句如何使用判断语句跳过验证卡密界面
  • ¥15 关于#wireshark#的问题:并且能够给数据做标注,如这个流量是在看视频或者是在转账
  • ¥15 运筹优化,gurobi,python
  • ¥20 springmvc重定向和返回json
  • ¥15 电脑键盘实现触摸功能