Biomaybe 2017-08-08 11:17 采纳率: 0%
浏览 1619

爬虫好难啊,求网页源代码分析,助考研一臂之力

我最近考研需要这个网站的视频,想用python爬下来。
这个网站的请求视频的地址好像是用代码生成的,而且需要手动点击才能抓到,抓包一个一个来好慢啊!!
后来发现这个网站的flash播放器的预览图地址和视频请求地址很相似,可是虽然这个预览图是默认加载的,可不过也只能在chrome的抓包里看到这个单独页面请求地址
最关键的问题还是这里的地址没有规律,地址有两个参数(图里面显示出来的那一段),有一个死活找不出来,求大神帮忙分析一下源代码,找出来这个地址的生成方法
如果有人能够有别的爬取的方法也可以的啊
网页地址:http://mooc.chaoxing.com/nodedetailcontroller/visitnodedetail?knowledgeId=757531![图片](https://img-ask.csdn.net/upload/201708/08/1502190679_257869.jpg)

  • 写回答

2条回答 默认 最新

  • 图图和牛爷爷 2017-08-08 15:13
    关注

    具体要抓那个视频,里面那么多的类别,用开发者工具点击视频看一下发的请求,提炼出来视频网址

    评论

报告相同问题?

悬赏问题

  • ¥20 有关区间dp的问题求解
  • ¥15 多电路系统共用电源的串扰问题
  • ¥15 slam rangenet++配置
  • ¥15 有没有研究水声通信方面的帮我改俩matlab代码
  • ¥15 对于相关问题的求解与代码
  • ¥15 ubuntu子系统密码忘记
  • ¥15 信号傅里叶变换在matlab上遇到的小问题请求帮助
  • ¥15 保护模式-系统加载-段寄存器
  • ¥15 电脑桌面设定一个区域禁止鼠标操作
  • ¥15 求NPF226060磁芯的详细资料