沐子果果 2023-01-17 18:29 采纳率: 33.3%
浏览 108
已结题

Python爬虫保存csv文件

请问如何将已经爬取出来的内容放到writer.writerows()的括号里,并将爬取出来的数据按照年份保存到对应的csv文件中。题目要求使用request库和beautifulsoup库🙏🙏🙏

img

  • 写回答

2条回答 默认 最新

  • cjh4312 2023-01-17 18:50
    关注
    import pandas as pd
    import requests
    data=pd.DataFrame()
    for i in range(1994,2023):
        url=f"http://www.boxofficecn.com/boxoffice{i}"
        headers = {
            'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36'
        }
        dd=requests.get(url,headers=headers)
        df=pd.read_html(dd.content.decode())[0]
        df.columns=['序列','年份','电影名称','票房总额(万元)']
        data=pd.concat([data,df])
    data.index = pd.RangeIndex(start=1, stop=len(data)+1, step=1)
    data.to_csv('e:/1.csv',encoding='gb18030')
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录
查看更多回答(1条)

报告相同问题?

问题事件

  • 已结题 (查看结题原因) 1月17日
  • 已采纳回答 1月17日
  • 修改了问题 1月17日
  • 修改了问题 1月17日
  • 展开全部

悬赏问题

  • ¥15 CST仿真别人的模型结果仿真结果S参数完全不对
  • ¥15 请问在阿里云服务器中怎么利用数据库制作网站
  • ¥60 ESP32怎么烧录自启动程序
  • ¥50 html2canvas超出滚动条不显示
  • ¥15 java业务性能问题求解(sql,业务设计相关)
  • ¥15 52810 尾椎c三个a 写蓝牙地址
  • ¥15 elmos524.33 eeprom的读写问题
  • ¥15 用ADS设计一款的射频功率放大器
  • ¥15 怎么求交点连线的理论解?
  • ¥20 软件开发方法学习来了