import requests
from lxml import etree
if name=='main':
header = {
'User-Agent':
'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:89.0) Gecko/20100098 Firefox/89.0'
}
url='https://www.bilibili.com/v/popular/history'
r=requests.get(url=url,headers=header).text
tree=etree.HTML(r)
title_list=tree.xpath('//div[@class="card-list"]/div')
for div in title_list:
title_data=title_list.xpath('/div/div[2]/p/text()')[0]
title_name=requests.get(url=title_data,headers=header).text
with open('bilibili.txt','w','utf-8') as fp:
fp.write(title_name)
print(title_name)
用python爬取bilibili的入站必刷榜单请问代码哪里错了
- 写回答
- 好问题 0 提建议
- 追加酬金
- 关注问题
- 邀请回答
-
2条回答 默认 最新
- CSDN专家-HGJ 2021-07-09 02:08关注
因为页面数据是js动态加载的,无法用代码中的方法解析到数据,可以通过开发者工具F12切换到XHR下找到相关数据链接,post请求获取json数据再解析。
如有帮助,望采纳。
本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 1无用
悬赏问题
- ¥30 Matlab打开默认名称带有/的光谱数据
- ¥50 easyExcel模板 动态单元格合并列
- ¥15 res.rows如何取值使用
- ¥15 在odoo17开发环境中,怎么实现库存管理系统,或独立模块设计与AGV小车对接?开发方面应如何设计和开发?请详细解释MES或WMS在与AGV小车对接时需完成的设计和开发
- ¥15 CSP算法实现EEG特征提取,哪一步错了?
- ¥15 游戏盾如何溯源服务器真实ip?需要30个字。后面的字是凑数的
- ¥15 vue3前端取消收藏的不会引用collectId
- ¥15 delphi7 HMAC_SHA256方式加密
- ¥15 关于#qt#的问题:我想实现qcustomplot完成坐标轴
- ¥15 下列c语言代码为何输出了多余的空格