想给家里老人爬取些广场舞的视频，遇到问题，求大神指导

打算先爬取视频内容合集页大概100左右数量的单个视频页的地址，再转到单个视频页爬取视频，但是返回的结果是空值，试过其他几种定位方式，都不行

import requests

from bs4 import BeautifulSoup

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.83 Safari/537.36',
    'Accept' : 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
    'Accept-Encoding' : 'gzip',
    'DNT' : '1', 
    'Connection' : 'close',
    'Accept-Language':'zh-CN'
}
f
url_address = 'https://haokan.baidu.com/author/1622522456467855'  
item_collection_responde = requests.get(url = url_address, headers = headers)
item_collection_soup = BeautifulSoup(item_collection_responde.content,  'lxml')
item_collection =  item_collection_soup.find_all('a', class_= 'card-item-link skeleton')

print(item_collection)

也试过第二步，直接在单个视频页抓取 <video>标签里的下载地址，也是返回空值

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

6条回答默认最新

天际的海浪 2021-02-20 15:27

关注

我又研究了一下，发现可以直接爬取好看视频网站的json数据

import requests

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.83 Safari/537.36',
    'Accept' : 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
    'Accept-Encoding' : 'gzip',
    'DNT' : '1',
    'Connection' : 'close',
    'Accept-Language':'zh-CN'
}

url_address = 'https://haokan.baidu.com/author/1622522456467855'

ctime = ""
while True:
    resjson = requests.get(url = f'{url_address}?_format=json&rn=16&ctime={ctime}&_api=1', headers = headers).json()
    response = resjson['data']['response']
    for it in response['results']:
        print("视频名称：",it['content']['title'])
        print("标清视频地址：",it['content']['video_list'].get('sd','无'))
        print("高清视频地址：",it['content']['video_list'].get('hd','无'))
        print("超清视频地址：",it['content']['video_list'].get('sc','无'))
        print()
    if response['has_more'] == 0:
        print("爬取结束")
        break
    ctime = response['ctime']

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(5条)

报告相同问题？

关注问题

python利用while循环求2到100内的素数，求大神指点 python 有问必答
2021-03-30 20:26

回答 5 已采纳 # 外层循环 i 从2循环到99 i = 2 while(i < 100): # 内层循环 j 从2循环到根号 i j = 2 while(j <= (i/j)): #
求大神解答python中的正则表达式问题 python 正则表达式
2016-10-13 05:04

回答 2 已采纳 ``` 取决于最少能匹配上的字符，比如 a.+?b 如果是abbbbbbb，则匹配为abb 如果是accbbbcbc，则匹配为accb 如果是a.+b，则分别为abbbbbbb和a
求大神指点Python温度转换代码报错原因,拜托了 python
2019-01-30 15:06

回答 5 已采纳楼主你的F=(eval(temp[0,-1])-32)/1.8写错了，temp[0,-1]修改为temp[0:-1]，截取最后一个字符的前的所有字符
python爬取头条付费专栏视频_用Python编写爬取头条视频的代码
2020-12-03 07:10

weixin_39810901的博客最近一直在头条上面看关于Python的视频，可头条视频没有下载选项。通过浏览器自带的开发者工具(Google按F12)可以查看到视频的地址，并进行下载。这是手动下载，每回查看感觉还是比较费事，就想用Python写个代码，...
Python出错问题,有没有大神给说说 python
2018-03-18 13:28

回答 1 已采纳提问的时候,最好能把问题描述清楚一些. 把代码贴出来,并指明TypeError是在哪一行发出的,大家才能很好的诊断问题. 只有一个TypeError,大家都不知道你给C代码传的是什么Python对
中标麒麟安装postfix遇到问题，求大神指导
2015-10-08 04:42

回答 1 已采纳 ``` # postconf "smtputf8_enable = no" # postfix reload_** ```
python 抓取POST 网页失败，求大神帮忙看下代码哪里有问题 python
2015-04-02 07:19

回答 3 已采纳两个格式是否完全一致?自己仔细对比一下
利用python对有规律的url进行视频爬取中遇到的小问题及解决方案
2018-11-29 15:46

安灏。的博客照着视频一行行敲完代码之后，尝试着运行了一下，果然开始爬取了，但运行一段时间后，出现了两个小问题。 ①爬取到的视频最长只有10s且清晰度很低，但是在网页上打开并不是这样的。（已解决） ②总共200+页的视频，...
python3.4下无法调用pymysql模块，耗时一天半问题尚未解决。求各位大神指导。 python 数据库
2017-03-08 12:46

回答 1 已采纳 http://www.cnblogs.com/woider/p/5926744.html
求大神帮忙：python pymssql模块安装成功，import pymssql 出错 python
2019-10-31 12:58

回答 3 已采纳这个信息看起来是警告吧，输出这个信息程序退出了吗？
python request 库POST请求从ajax爬取数据遇到formdata不会处理了 ajax python 爬虫
2018-06-11 02:48

回答 2 已采纳刚看了一下你的代码：改了一下，我加了查询日期，6月1日到6月11的。其他字段自己加上就行了： import requests url = "http://www.ccgp-shaa
python爬取别人qq空间相册_python+selenium+requests爬取qq空间相册时遇到的问题及解决思路...
2020-11-25 03:04

weixin_39815410的博客最近研究了下用python爬取qq空间相册的问题，遇到的问题及解决思路如下：1、qq空间相册的访问需要qq登录并且需是好友，requests模块模拟qq登录略显麻烦，所以采用selenium的driver登录，登录成功之后获取其cookie...
python opencv 图片前景与背景的分割，拜大神求如何改错 python 机器学习
2019-08-21 16:58

回答 2 已采纳我试了一下，如果你用window系统，在绝对路经中用双“\\", 列如： srcImage = cv2.imread('C:\\\\Users\\\\fw\\\\Anaconda3\\\\Lib\\\
python爬取加密qq空间_python+selenium+requests爬取qq空间相册时遇到的问题及解决思路...
2020-11-23 23:26

weixin_39598069的博客最近研究了下用python爬取qq空间相册的问题，遇到的问题及解决思路如下：1、qq空间相册的访问需要qq登录并且需是好友，requests模块模拟qq登录略显麻烦，所以采用selenium的driver登录，登录成功之后获取其cookie...
如何用Python将普通视频变成动漫视频
2022-08-13 15:51

轻松学Python的博客最近几个月，毒教材被曝光引发争议，那些编写度教材的人着实可恶。咱程序员也没有手绘插画能力，但咱可以借助强大的深度学习模型...所以今天的目标是让任何具有python语言基本能力的程序员，实现短视频转动漫效果。...
没有解决我的问题, 去提问

悬赏问题

¥15 逻辑谓词和消解原理的运用
¥15 请求分析基于spring boot+vue的前后端分离的项目
¥15 三菱伺服电机按启动按钮有使能但不动作
¥15 js，页面2返回页面1时定位进入的设备
¥200 关于#c++#的问题，请各位专家解答！网站的邀请码
¥50 导入文件到网吧的电脑并且在重启之后不会被恢复
¥15 （希望可以解决问题）ma和mb文件无法正常打开，打开后是空白，但是有正常内存占用，但可以在打开Maya应用程序后打开场景ma和mb格式。
¥20 ML307A在使用AT命令连接EMQX平台的MQTT时被拒绝
¥20 腾讯企业邮箱邮件可以恢复么
¥15 有人知道怎么将自己的迁移策略布到edgecloudsim上使用吗？

码龄粉丝数原力等级 --

想给家里老人爬取些广场舞的视频，遇到问题，求大神指导

6条回答默认最新

码龄粉丝数原力等级 --

悬赏问题

想给家里老人爬取些广场舞的视频，遇到问题，求大神指导

6条回答 默认 最新

悬赏问题

6条回答默认最新