线条同学 2024-05-03 19:31 采纳率: 83.3%
浏览 2

前一部分混有数字,我如何修改代码获得只有文字的b站弹幕呢

我是搜了一个教程来爬去b站弹幕,但是我运行的结果前一部分还是混有数字,但是后面就是我想要的(只有文字部分)我猜测是因为那个教程用的是pycharm,我用的是jupyter这个不同导致的。我如何修改呢

img

  • 写回答

4条回答 默认 最新

  • 专家-赤兔[在线] 全栈领域优质创作者 2024-05-03 19:32
    关注

    引自免费微信小程序:皆我百晓生

    为了从B站API获取纯文本弹幕,你需要解析JSON数据而非HTML。首先,确保你已经安装了requests库,如果没有安装,可以使用以下命令进行安装:

    pip install requests
    

    接下来,我将提供一个完整的Python代码示例,用于从给定的URL获取纯文本弹幕。

    import json
    import requests
    
    # 目标URL
    url = 'https://api.bilibili.com/x/v1/dm/list.so?oid=356782255'
    
    # 请求头
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/109.0.0.0 Safari/537.36 SLBrowser/9.'
    }
    
    # 发送GET请求
    response = requests.get(url=url, headers=headers)
    
    # 解析响应为JSON格式
    data = response.json()
    
    # 提取弹幕信息
    danmu_list = data['data']['dms']
    
    # 提取并打印纯文本弹幕
    text_danmus = [dm['text'] for dm in danmu_list]
    for text in text_danmus:
        print(text)
    

    这段代码会发送GET请求到指定的URL,并解析返回的JSON数据。然后,它会提取出包含弹幕信息的列表,并从中提取出每个弹幕的文本内容。最后,代码会打印出所有的纯文本弹幕。

    注意:由于B站可能会更改其API结构,因此这段代码可能需要根据未来的变化进行调整。此外,B站有可能对频繁的请求进行限制,因此在实际应用中,你可能需要添加适当的延迟或其他机制来防止被封禁。

    评论

报告相同问题?

问题事件

  • 创建了问题 5月3日

悬赏问题

  • ¥15 如何构建全国统一的物流管理平台?
  • ¥100 ijkplayer使用AndroidStudio/CMake编译,如何支持 rtsp 直播流?
  • ¥20 和学习数据的传参方式,选择正确的传参方式有关
  • ¥15 这是网络安全里面的poem code
  • ¥15 用js遍历数据并对非空元素添加css样式
  • ¥15 使用autodl云训练,希望有直接运行的代码(关键词-数据集)
  • ¥50 python写segy数据出错
  • ¥20 关于线性结构的问题:希望能从头到尾完整地帮我改一下,困扰我很久了
  • ¥30 3D多模态医疗数据集-视觉问答
  • ¥20 设计一个二极管稳压值检测电路