Biomaybe 2017-08-08 11:17 采纳率: 0%
浏览 1619

爬虫好难啊,求网页源代码分析,助考研一臂之力

我最近考研需要这个网站的视频,想用python爬下来。
这个网站的请求视频的地址好像是用代码生成的,而且需要手动点击才能抓到,抓包一个一个来好慢啊!!
后来发现这个网站的flash播放器的预览图地址和视频请求地址很相似,可是虽然这个预览图是默认加载的,可不过也只能在chrome的抓包里看到这个单独页面请求地址
最关键的问题还是这里的地址没有规律,地址有两个参数(图里面显示出来的那一段),有一个死活找不出来,求大神帮忙分析一下源代码,找出来这个地址的生成方法
如果有人能够有别的爬取的方法也可以的啊
网页地址:http://mooc.chaoxing.com/nodedetailcontroller/visitnodedetail?knowledgeId=757531![图片](https://img-ask.csdn.net/upload/201708/08/1502190679_257869.jpg)

  • 写回答

2条回答

  • 图图和牛爷爷 2017-08-08 15:13
    关注

    具体要抓那个视频,里面那么多的类别,用开发者工具点击视频看一下发的请求,提炼出来视频网址

    评论

报告相同问题?

悬赏问题

  • ¥15 如何实现从tello无人机上获取实时传输的视频流,然后将获取的视频通过yolov5进行检测
  • ¥15 WPF使用Canvas绘制矢量图问题
  • ¥15 用三极管设计一个单管共射放大电路
  • ¥15 孟德尔随机化r语言运行问题
  • ¥15 pyinstaller编译的时候出现No module named 'imp'
  • ¥15 nirs_kit中打码怎么看(打码文件是csv格式)
  • ¥15 怎么把多于硬盘空间放到根目录下
  • ¥15 Matlab问题解答有两个问题
  • ¥15 LCD12864中文显示
  • ¥15 在使用CH341SER.EXE时不小心把所有驱动文件删除了怎么解决