f1msch067 2021-04-26 18:23 采纳率: 100%
浏览 54
已采纳

pandas的向量化处理怎么比普通迭代还慢很多

我用了如下三种方法测量pandas列之间相加的效率:1.向量化 2.iterrows迭代 3.先转化成numpy再相加

按道理 向量化处理 肯定要比迭代快啊 为什么实际测下来会慢这么多呢?

df1 = pd.DataFrame({'aaa':{'0':0},
                    'bbb':{'0':8568}
                    ,'ccc':{'0':1}
                    ,'ddd':{'0':0}})
print(df1)
t = timeit.timeit(stmt="df1['aaa']+df1['bbb']+df1['ccc']+df1['ddd']", setup="from  __main__ import df1",number=10000)
print(t)
t = timeit.timeit(stmt="for index,row in df1.iterrows():"
                  "row['aaa']+row['bbb']+row['ccc']+row['ddd']", setup="from  __main__ import df1",number=10000)
print(t)

t = timeit.timeit(stmt="df1['aaa'].values+df1['bbb'].values+df1['ccc'].values+df1['ddd'].values", setup="from  __main__ import df1",number=10000)
print(t)

 

运行结果

   aaa   bbb  ccc  ddd
0    0  8568    1    0
2.639297500019893
0.6697011000069324
0.0938532000000123

  • 写回答

4条回答 默认 最新

  • CSDN专家-孙老师 2021-04-26 18:50
    关注

    第一种表示Series相加,不是向量化处理,Series相加,会根据索引进行操作,索引相同则数值相加,肯定会比数值相加慢。

    向量其实就是一维数组,Numpy数组操作是最快的。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(3条)

报告相同问题?

悬赏问题

  • ¥15 关于#目标检测#的问题:大概就是类似后台自动检测某下架商品的库存,在他监测到该商品上架并且可以购买的瞬间点击立即购买下单
  • ¥15 神经网络怎么把隐含层变量融合到损失函数中?
  • ¥30 自适应 LMS 算法实现 FIR 最佳维纳滤波器matlab方案
  • ¥15 lingo18勾选global solver求解使用的算法
  • ¥15 全部备份安卓app数据包括密码,可以复制到另一手机上运行
  • ¥20 测距传感器数据手册i2c
  • ¥15 RPA正常跑,cmd输入cookies跑不出来
  • ¥15 求帮我调试一下freefem代码
  • ¥15 matlab代码解决,怎么运行
  • ¥15 R语言Rstudio突然无法启动