keepononon_____ 2022-01-12 21:15 采纳率: 77.8%
浏览 52
已结题

我有60万行数据,excel文件300多兆。我用pandas 把其中6列值为0的替换为别的值。python运行了快一个小时

我有60万行数据,excel文件300多兆。我用pandas 把其中6列值为0的替换为别的值。python运行了快一个小时,都没有出结果,请问有什么可以解决的么?
data= pd.read_excel('a.xlsx',sheet_name='b')

data['Cancel order']=data['Cancel order'].replace("0","")
data['Cancel order2']=data['Cancel order2'].replace("0","")
data.to_excel('result5.xlsx',sheet_name='Sheet1',index=None,header=True)

运行结果及报错内容


怎么提高处理速度
  • 写回答

3条回答 默认 最新

  • 关注

    每列数据更改使用线程,data改为全局变量
    使用的时候在子线程中更改数据,每个子线程更改一列数据
    主线程检测子线程是否结束所有子线程,主线程保存data值,这样可以大大加快读写的时间
    例子

    
    import time
    from threading import Thread
    import pandas as pd
    data = None
    
    
    def datareplace(name,oldv = "0",newv = ""):
        global data
        if data:
            data[name] = data[name].replace(oldv,newv)
        else:
            print('data is None')
    
    
    def main():
        global data
        data = pd.read_excel('a.xlsx',sheet_name = 'b')
        one = Thread(target = datareplace,args = ('Cancel order',),kwargs = {"oldv":"0","newv":""})
        tow = Thread(target = datareplace,args = ('Cancel order2',),kwargs = {"oldv":"0","newv":""})
        timenumber = 0
        print("开始操作")
        while True:
            if one.is_alive() or tow.is_alive():
                time.sleep(1)
                print('\r',end = '')
                timenumber += 1
                print(f"执行了{timenumber}秒",end = '')
            else:
                print('\r',end = '')
                print(f"程序结束,共用{timenumber}秒",end = '')
                break
        data.to_excel('result5.xlsx',sheet_name = 'Sheet1',index = None,header = True)
    

    有帮助请点一下右上角的采纳,谢谢

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

问题事件

  • 系统已结题 9月24日
  • 已采纳回答 9月16日
  • 创建了问题 1月12日

悬赏问题

  • ¥15 虚幻5 UE美术毛发渲染
  • ¥15 CVRP 图论 物流运输优化
  • ¥15 Tableau online 嵌入ppt失败
  • ¥100 支付宝网页转账系统不识别账号
  • ¥15 基于单片机的靶位控制系统
  • ¥15 真我手机蓝牙传输进度消息被关闭了,怎么打开?(关键词-消息通知)
  • ¥15 装 pytorch 的时候出了好多问题,遇到这种情况怎么处理?
  • ¥20 IOS游览器某宝手机网页版自动立即购买JavaScript脚本
  • ¥15 手机接入宽带网线,如何释放宽带全部速度
  • ¥30 关于#r语言#的问题:如何对R语言中mfgarch包中构建的garch-midas模型进行样本内长期波动率预测和样本外长期波动率预测