a15002098257 2021-07-08 22:20 采纳率: 100%
浏览 59
已采纳

用python爬取bilibili的入站必刷榜单请问代码哪里错了

import requests
from lxml import etree
if name=='main':
header = {
'User-Agent':
'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:89.0) Gecko/20100098 Firefox/89.0'
}
url='https://www.bilibili.com/v/popular/history'
r=requests.get(url=url,headers=header).text
tree=etree.HTML(r)
title_list=tree.xpath('//div[@class="card-list"]/div')
for div in title_list:
title_data=title_list.xpath('/div/div[2]/p/text()')[0]
title_name=requests.get(url=title_data,headers=header).text
with open('bilibili.txt','w','utf-8') as fp:
fp.write(title_name)
print(title_name)

  • 写回答

2条回答 默认 最新

  • CSDN专家-HGJ 2021-07-09 02:08
    关注

    因为页面数据是js动态加载的,无法用代码中的方法解析到数据,可以通过开发者工具F12切换到XHR下找到相关数据链接,post请求获取json数据再解析。

    如有帮助,望采纳。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 已采纳回答 7月9日
  • 创建了问题 7月8日

悬赏问题

  • ¥15 Matlab在app上输入带有矩阵形式的初始条件发生错误
  • ¥15 CST仿真别人的模型结果仿真结果S参数完全不对
  • ¥15 误删注册表文件致win10无法开启
  • ¥15 请问在阿里云服务器中怎么利用数据库制作网站
  • ¥60 ESP32怎么烧录自启动程序
  • ¥50 html2canvas超出滚动条不显示
  • ¥15 java业务性能问题求解(sql,业务设计相关)
  • ¥15 52810 尾椎c三个a 写蓝牙地址
  • ¥15 elmos524.33 eeprom的读写问题
  • ¥15 用ADS设计一款的射频功率放大器