线条同学 2024-05-03 21:06 采纳率: 83.3%
浏览 5
已结题

如图,如何将爬取到的弹幕导入excel表格中呢

img


我用的是jupyter,如何将爬取到的数据导入excel表格中呢

  • 写回答

3条回答 默认 最新

  • 专家-赤兔[在线] 全栈领域优质创作者 2024-05-03 21:06
    关注

    引自免费微信小程序:皆我百晓生

    为了将爬取到的弹幕数据导入Excel表格,你需要使用pandas库。首先确保已经安装了pandas和openpyxl(用于写入Excel)这两个库,如果没有安装,可以使用pip命令安装:

    pip install pandas openpyxl
    

    接下来,我会提供一个完整的Python代码示例,包括解析网页、提取弹幕以及将数据写入Excel。

    import requests
    from bs4 import BeautifulSoup
    import re
    import pandas as pd
    
    # 定义请求头
    headers = {
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/109.0."
    }
    
    # 爬取网页
    response = requests.get("https://api.bilibili.com/x/v1/dm/list.so?oid=356782255", headers=headers)
    
    # 解析HTML并获取弹幕
    html_doc = response.content.decode('utf-8')
    format = re.compile("<d.*?>(.*?)</d>")
    danmus = format.findall(html_doc)
    
    # 创建DataFrame
    data = {"Danmu": danmus}
    
    df = pd.DataFrame(data)
    
    # 将DataFrame写入Excel
    df.to_excel("danmus.xlsx", index=False)
    

    这段代码会将抓取到的弹幕保存在一个名为danmus.xlsx的Excel文件中。如果你有多个页面需要处理,只需在循环中调用上述代码,并改变网页URL即可。记得替换实际的oid值,这里使用的是356782255作为示例。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录
查看更多回答(2条)

报告相同问题?

问题事件

  • 系统已结题 5月11日
  • 已采纳回答 5月3日
  • 创建了问题 5月3日

悬赏问题

  • ¥15 如何构建全国统一的物流管理平台?
  • ¥100 ijkplayer使用AndroidStudio/CMake编译,如何支持 rtsp 直播流?
  • ¥20 和学习数据的传参方式,选择正确的传参方式有关
  • ¥15 这是网络安全里面的poem code
  • ¥15 用js遍历数据并对非空元素添加css样式
  • ¥15 使用autodl云训练,希望有直接运行的代码(关键词-数据集)
  • ¥50 python写segy数据出错
  • ¥20 关于线性结构的问题:希望能从头到尾完整地帮我改一下,困扰我很久了
  • ¥30 3D多模态医疗数据集-视觉问答
  • ¥20 设计一个二极管稳压值检测电路