我是搜了一个教程来爬去b站弹幕,但是我运行的结果前一部分还是混有数字,但是后面就是我想要的(只有文字部分)我猜测是因为那个教程用的是pycharm,我用的是jupyter这个不同导致的。我如何修改呢
前一部分混有数字,我如何修改代码获得只有文字的b站弹幕呢
- 写回答
- 好问题 0 提建议
- 追加酬金
- 关注问题
- 邀请回答
-
4条回答 默认 最新
关注 引自免费微信小程序:皆我百晓生
为了从B站API获取纯文本弹幕,你需要解析JSON数据而非HTML。首先,确保你已经安装了
requests
库,如果没有安装,可以使用以下命令进行安装:pip install requests
接下来,我将提供一个完整的Python代码示例,用于从给定的URL获取纯文本弹幕。
import json import requests # 目标URL url = 'https://api.bilibili.com/x/v1/dm/list.so?oid=356782255' # 请求头 headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/109.0.0.0 Safari/537.36 SLBrowser/9.' } # 发送GET请求 response = requests.get(url=url, headers=headers) # 解析响应为JSON格式 data = response.json() # 提取弹幕信息 danmu_list = data['data']['dms'] # 提取并打印纯文本弹幕 text_danmus = [dm['text'] for dm in danmu_list] for text in text_danmus: print(text)
这段代码会发送GET请求到指定的URL,并解析返回的JSON数据。然后,它会提取出包含弹幕信息的列表,并从中提取出每个弹幕的文本内容。最后,代码会打印出所有的纯文本弹幕。
注意:由于B站可能会更改其API结构,因此这段代码可能需要根据未来的变化进行调整。此外,B站有可能对频繁的请求进行限制,因此在实际应用中,你可能需要添加适当的延迟或其他机制来防止被封禁。
解决 无用评论 打赏 举报
悬赏问题
- ¥15 如何构建全国统一的物流管理平台?
- ¥100 ijkplayer使用AndroidStudio/CMake编译,如何支持 rtsp 直播流?
- ¥20 和学习数据的传参方式,选择正确的传参方式有关
- ¥15 这是网络安全里面的poem code
- ¥15 用js遍历数据并对非空元素添加css样式
- ¥15 使用autodl云训练,希望有直接运行的代码(关键词-数据集)
- ¥50 python写segy数据出错
- ¥20 关于线性结构的问题:希望能从头到尾完整地帮我改一下,困扰我很久了
- ¥30 3D多模态医疗数据集-视觉问答
- ¥20 设计一个二极管稳压值检测电路