m0_71721602 2022-06-28 00:05 采纳率: 100%
浏览 141
已结题

关于按内容拆分EXCEL表格

关于Excel表格拆分,诚邀解答:
一张十万条以上数据的表格,A、b、c列内有相同数据,要求根据这三列内相同数据拆分为多个表格文件,并将这几列的首个单元格内容及c列首个单元格内容的后四个字符合并为文件名,且拆分后的表格保留源表格式(不能出现科学计数法- -)。
平台:win系统,只有VBA、Python
另:在下初学,有劳兄台解答时注明使用平台及需要安装哪些环境,代码加注释,感激不尽。
以如下图表格为例,要求以职务、性别、出生日期三列内相同的内容分别拆分为新表格,且新表格文件名为“性别&职务&出生日期(后四位)”并保留源格式。

img

  • 写回答

3条回答 默认 最新

  • chuifengde 2022-06-28 10:13
    关注
    dirname=r'C:\Users\Administrator\Desktop'
    import pandas as pd
    import os
    
    df = pd.read_csv(dirname + "/aa.csv", encoding = 'gbk')
    print(df)
    
    res = df.groupby(['职务', '性别', '出生日期'])
    for i,d in res:
        filename = i[0] + '_' + i[1] + '_' +str(i[2])[-4:] + r'.csv'
        d.to_csv(os.path.join(dirname, filename), index = False)
    

    img

    以上为csv文本gbk格式,以下为excel格式:

    dirname=r'C:\Users\Administrator\Desktop'
    import pandas as pd
    import os
    
    df = pd.read_excel(dirname + "/aa.xlsx")
    print(df)
    
    res = df.groupby(['职务', '性别', '出生日期'])
    for i,d in res:
        filename = i[0] + '_' + i[1] + '_' +str(i[2])[-4:] + r'.xlsx'
        d.to_csv(os.path.join(dirname, filename), index = False)
    
    

    img

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录
查看更多回答(2条)

报告相同问题?

问题事件

  • 系统已结题 7月8日
  • 已采纳回答 6月30日
  • 创建了问题 6月28日

悬赏问题

  • ¥15 请问读取环境变量文件失败是什么原因?
  • ¥15 在若依框架下实现人脸识别
  • ¥15 网络科学导论,网络控制
  • ¥100 安卓tv程序连接SQLSERVER2008问题
  • ¥15 利用Sentinel-2和Landsat8做一个水库的长时序NDVI的对比,为什么Snetinel-2计算的结果最小值特别小,而Lansat8就很平均
  • ¥15 metadata提取的PDF元数据,如何转换为一个Excel
  • ¥15 关于arduino编程toCharArray()函数的使用
  • ¥100 vc++混合CEF采用CLR方式编译报错
  • ¥15 coze 的插件输入飞书多维表格 app_token 后一直显示错误,如何解决?
  • ¥15 vite+vue3+plyr播放本地public文件夹下视频无法加载