爬虫好难啊，求网页源代码分析，助考研一臂之力

我最近考研需要这个网站的视频，想用python爬下来。
这个网站的请求视频的地址好像是用代码生成的，而且需要手动点击才能抓到，抓包一个一个来好慢啊！！
后来发现这个网站的flash播放器的预览图地址和视频请求地址很相似，可是虽然这个预览图是默认加载的，可不过也只能在chrome的抓包里看到这个单独页面请求地址
最关键的问题还是这里的地址没有规律，地址有两个参数（图里面显示出来的那一段），有一个死活找不出来，求大神帮忙分析一下源代码，找出来这个地址的生成方法
如果有人能够有别的爬取的方法也可以的啊
网页地址：http://mooc.chaoxing.com/nodedetailcontroller/visitnodedetail?knowledgeId=757531![图片](https://img-ask.csdn.net/upload/201708/08/1502190679_257869.jpg)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
图图和牛爷爷 2017-08-08 15:13
关注
具体要抓那个视频，里面那么多的类别，用开发者工具点击视频看一下发的请求，提炼出来视频网址

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python爬虫爬取网页代码遇到了一些问题 python 爬虫
2022-08-17 17:07

回答 3 已采纳因为元素里的你要的内容是通过 ajax 请求动态加载的，可以浏览器抓包去看下，你想要的这条数据到底是哪个请求返回的，找到真正的请求，然后模拟发送就行了
Python爬虫爬取网页源代码为空，求问原因&解决方案（向） python 爬虫
2015-08-11 04:55

回答 5 已采纳代码： ``` #!/usr/bin/env python3 #-*- coding=utf-8 -*- import urllib3 if __name__ == '
python后端开发或爬虫怎么系统学习？ python 后端爬虫
2023-04-13 13:18

回答 1 已采纳爬虫严格来讲并不算一个大方向，更偏向于js逆向，python的话推荐走后端方向至于系统学习的话，推荐去blibili找一些路线，然后根据路线去找bilibili上播放量比较高的视频进行系统学习
81个Python爬虫源代码
2018-12-13 14:23

81个Python爬虫源代码，内容包含新闻、视频、中介、招聘、图片资源等网站的爬虫资源
爬虫中的源代码没有链接但是已经能打开新网页 python
2021-09-11 12:34

回答 1 已采纳看到上面的onclick了吗，点击的时候，会执行js，然后通过js代码访问了新的链接
python爬虫问题，在网页代码找不到自己想要的数据 python 爬虫
2022-02-24 11:15

回答 2 已采纳那个网站啊.你看下是不是写在接口中.F12开发者模式.选择XHR看下
求 vb同时爬取网页数据的代码！！ .net
2021-07-27 10:11

回答 2 已采纳 Class spd'定义爬虫类 Public url as String'定义url Sub sp()'定义方法 With CreateObject("Microsoft.XMLHTTP") .Ope
爬取淘宝商品数据项目的源代码
2022-03-05 22:13

爬取淘宝商品数据项目的源代码
爬虫在原代码里面没有，但是在网页里面有的东西 python selenium 爬虫
2023-01-07 20:57

回答 1 已采纳是不是通过xpath爬取时，没有找到对应的元素，定位的表达式怎么写的？
苏宁爬虫源代码与实际页面不符爬虫
2018-10-16 03:13

回答 1 已采纳你打开的第一页，其实在你往下划的时候网页加载了XHR，所以你使用seleniem也需要模拟下滑 ``` driver.execute_script("window.scrollBy(0,5
爬虫 POST请求获取网页标题内容 python 爬虫
2022-10-26 16:35

回答 1 已采纳 post和get方法的使用不是你决定的，二十接口使用的是什么请求方式，如果它是get请求那就只能用get请求，是post就只能用post
python爬虫获取网页源代码
2019-02-26 10:27

xiucai_cs的博客 # 获取网页源代码 kv = {'user-agent':'Mozilla/5.0'} # 请求头信息，相当于一个浏览器面具 html = requests.get('http://tieba.baidu.com/f?ie=utf-8&kw=python&red_tag=g1015520224',headers=kv) ...
python爬虫爬到的网页内容不完全 python 爬虫网络
2021-10-31 23:19

回答 1 已采纳 beautifulsoup是爬静态网页的，应该是有些内容属于动态，可以尝试selenium
Python爬虫获取网页源代码出现乱码
2022-01-11 19:52

滚雪球~的博客通过如下代码，会发现获取的网页源代码出现乱码 url = 'https://www.baidu.com' res = requests.get(url).text print(res) 出现乱码查看python获得的编码格式 import requests # 0.通过如下代码，会发现获取的...
python爬虫实验——爬取网页图片+网页源代码
2020-07-07 17:04

小怪兽655的博客爬虫图片本实验将利用python程序抓取网络图片，完成可以批量下载一个网站的照片。所谓网页抓取，就是把URL地址中指定的网络资源从网络流中读取出来，保存到本地。原理 1、网络爬虫即Web Spider，网络蜘蛛是通过...
没有解决我的问题, 去提问

悬赏问题

¥15 如何实现从tello无人机上获取实时传输的视频流，然后将获取的视频通过yolov5进行检测
¥15 WPF使用Canvas绘制矢量图问题
¥15 用三极管设计一个单管共射放大电路
¥15 孟德尔随机化r语言运行问题
¥15 pyinstaller编译的时候出现No module named 'imp'
¥15 nirs_kit中打码怎么看(打码文件是csv格式)
¥15 怎么把多于硬盘空间放到根目录下
¥15 Matlab问题解答有两个问题
¥15 LCD12864中文显示
¥15 在使用CH341SER.EXE时不小心把所有驱动文件删除了怎么解决