2022也爱高数 2023-12-10 11:34 采纳率: 0%
浏览 7

python如何把爬出来的数据导入到excel里

请问各位:python如何把爬出来的数据导入到excel里
还是初学者,这是自己改的一个代码,前面爬虫都没问题,加上导出文件之后就报错了。
TypeError: 'NoneType' object is not callable
因为刚接触,还不会把数据导出成excel,想求问各位怎么导出


import requests
from bs4 import BeautifulSoup
import pandas as pd

headers={
    "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/119.0.0.0 Safari/537.36 Edg/119.0.0.0"
}
for start_num in range(20,260,20):
    response = requests.get(f"https://movie.douban.com/subject/26357307/comments?start={start_num}&limit=20&status=P&sort=new_score",headers=headers)
    html=response.text
    soup=BeautifulSoup(html,"html.parser")
    all_titles=soup.findAll("span",attrs={"class":"short"})
    for title in all_titles:
        print(title.string)

title.to_excel('影评.xlsx')
  • 写回答

2条回答 默认 最新

  • CSDN-Ada助手 CSDN-AI 官方账号 2023-12-10 14:23
    关注

    【以下回答由 GPT 生成】

    可以使用pandas库将爬取到的数据导入到Excel表格中。以下是具体的解决方案:

    1. 首先,确保已经安装了pandas库。可以使用以下命令进行安装:
    pip install pandas
    
    1. 在代码中导入pandas库:
    import pandas as pd
    
    1. 创建一个空的列表,用于存储爬取到的数据:
    data_list = []
    
    1. 在爬取到数据的地方,将数据添加到列表中:
    for title in all_titles:
        data_list.append(title.string)
    
    1. 将列表转换为pandas的DataFrame对象:
    df = pd.DataFrame(data_list, columns=['Data'])
    
    1. 将DataFrame对象导出到Excel表格中:
    df.to_excel('data.xlsx', index=False)
    

    完整的修改后的代码如下所示:

    import requests
    from bs4 import BeautifulSoup
    import pandas as pd
    
    headers = {
        "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/119.0.0.0 Safari/537.36 Edg/119.0.0.0"
    }
    
    data_list = []
    
    for start_num in range(20,260,20):
        response = requests.get(f"https://movie.douban.com/subject/26357307/comments?start={start_num}&limit=20&status=P&sort=new_score", headers=headers)
        html = response.text
        soup = BeautifulSoup(html, "html.parser")
        all_titles = soup.findAll("span", attrs={"class":"short"})
        for title in all_titles:
            data_list.append(title.string)
    
    df = pd.DataFrame(data_list, columns=['Data'])
    df.to_excel('data.xlsx', index=False)
    

    此代码将数据保存为名为"data.xlsx"的Excel文件,其中数据将保存在名为"Data"的列中。

    如果在运行代码时仍然遇到错误,请提供完整的错误信息,以便进一步排查问题。



    【相关推荐】



    如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^
    评论

报告相同问题?

问题事件

  • 创建了问题 12月10日

悬赏问题

  • ¥15 对接wps协作接口实现消息发送
  • ¥15 SQLite 出现“Database is locked” 如何解决?
  • ¥15 已经加了学校的隶属邮箱了,为什么还是进不去github education?😭
  • ¥15 求会做聚类,TCN的朋友有偿线上指导。以下是目前遇到的问题
  • ¥100 无网格伽辽金方法研究裂纹扩展的程序
  • ¥15 错误于library(org.Hs.eg.db): 不存在叫‘org.Hs.eg.db’这个名称的程序包,如何解决?
  • ¥60 求一个图片处理程序,要求将图像大小跟现实生活中的大小按比例联系起来的
  • ¥50 求一位精通京东相关开发的专家
  • ¥100 求懂行的大ge给小di解答下!
  • ¥15 pcl运行在qt msvc2019环境运行效率低于visual studio 2019