如何提高这段代码的运行速度？

手头有一些数据，需要统计某几个指定字段，与标准字段数值的比较。统计超过标准值的字段个数。
大致数据格式如下：
图片说明

我的代码如下：（个人觉得有更快速的方法来解决）

def cal(x):
    cnt = 0
    for i in data.columns[:5]:
        if x[i] > x['ZB']:
            cnt +=1
    return cnt
data['XX'] = data.apply(cal,axis=1)

结果1000行的数据，运行起来貌似偏慢了点，要0.2秒左右。。
想请教下高手，有没办法可以提高效率？
如用np.where等方法来处理。。（主要考虑到以后如果有100W+的数据，不是得跑很久。。）

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

D720CJM 2019-05-29 19:56

关注

怎么弄都是那样了，尽量少转换，少生成新变量呗……
不过，何不开多线程呢？
把需要处理的项目分成一行行来处理，多行就多个线程同时统计，最后再把统计的结果相加。

from concurrent.futures import ThreadPoolExecutor
pool = ThreadPoolExecutor(max_workers=15) # 最大线程数设置

def cal(x):
    cnt = 0
    for i in data.columns[:5]:
        if x[i] > x['ZB']:
            cnt +=1
    return cnt
data['XX'] = data.apply(cal,axis=1)

parms = [1,2,3……] # 参数列表
rets = list()
gen = pool.map(cal, parms) **# 加入线程池，返回gen是一个iterators
rets.extend(list(gen)) # 这样rets就是每一行的统计结果cnt了
cnt = 0
for i in rets: 
    cnt += i
pool.shutdown() # 关闭线程池（确保你不要再用线程的地方）
# 这里你自己想办法生成参数列表parms，比如说range(min_row, max_row + 1)，那么就是parms = [i for i in range(min_row, max_row + 1)]
# 把parms作为参数传递进cal函数，那么cal(1)就是第一行，cal(2)就是第二行了……以此类推。用多线程，少量任务时不见得更快，但很多数据还是好使的
# PS：map()接收一个函数 f 和一个list(或多个 list,但list个数与f函数的参数个数必须相等)，并通过把函数 f 依次作用在 list 的每个元素上，得到一个新的 iterators 并返回。

不大懂你的data['XX'] = data.apply(cal,axis=1)是什么……

要不就还是你原来的代码，但是加上jit，变成这样试试

from numba import jit

@jit
def cal(x):
    cnt = 0
    for i in data.columns[:5]:
        if x[i] > x['ZB']:
            cnt +=1
    return cnt
data['XX'] = data.apply(cal,axis=1)

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(2条)

报告相同问题？

关注问题

python中用函数可以提高代码运行速度吗_为什么Python代码在函数中运行得更快？...
2021-03-17 18:53

weixin_39806288的博客发现如果python代码正常运行，然后在python函数中运行，则在后一种情况下运行速度更快。我想知道为什么python代码在函数中运行得更快。通常发现在python函数中存储局部变量要比全局变量更快。可以解释如下。除了局部...
python函数可以提高代码执行速度吗_优化代码，加速Python运行的八大方法
2020-11-24 06:51

weixin_39705069的博客 Python有时用起来确实很慢，我敢打赌你肯定抱怨过这一点，尤其是那些用惯了C，C ++或Java的人。但其实很多时候，Python的效率并没有达到它应有的速度，有一些让它马达开足的小技巧，一起来学习吧！1.避免使用全局...
python中函数可以提高代码执行速度吗_为什么Python代码在函数中运行得更快？
2020-11-30 08:27

weixin_39874379的博客下面是函数循环的字节码：>> 13 FOR_ITER 6 (to 22) # get next value from iterator 16 STORE_FAST 0 (x) # set local variable 19 JUMP_ABSOLUTE 13 # back to FOR_ITER 通常，当程序运行时，Python会一个接一个地...
如何运行一段python代码_如何运行Python程序
2020-11-20 22:54

weixin_39958631的博客使用Python自带的IDLE 在开始-->程序-->Python2.5(视你安装的版本而不同32313133353236313431303231363533e4b893e5b19e31333332636338)中找到IDLE(Python GUI)，点击后弹出如下窗体：在>>>提示符后输入代码，回车，...
python提高for循环速度_提升Python运行效率的小窍门
2020-11-28 17:52

weixin_39612733的博客原标题：提升Python运行效率的小窍门说起Python，作为一门大热的编程语言，它简单易学、语法优美，自身拥有丰富强大的库，而且应用...针对这个问题，下面为大家搜集了6个可以提高Python运行效率的小窍门。//窍门一...
为什么Python运行速度这么慢？有什么解决方法吗？
2024-11-07 19:27

爱编程的鱼的博客相比之下，汇编语言则需要针对不同处理器的指令集编写特定程序，这就意味着同一段代码无法在不同CPU架构的计算机上通用。相比之下，静态类型语言在编译阶段就确定了变量类型，因此能够进行更积极的代码优化，从而...
如何防止你的代码被窃取？Python代码加密方案汇总（带实例验证）
2020-09-01 22:23

禅与电脑维修艺术的博客如何防止你的Python代码被人窃取？本文以实例展示了难度和安全性不同的5种Python代码加密方法，希望能对你有所帮助。
终端和文件运行python代码
2023-04-12 10:32

suoh's Blog的博客在我们Python开发中，pycharm由捷克公司JetBrains开发的一款IDE,提供代码分析、图形化调试器，集成测试器、集成版本控制系统等，主要用来编写Python代码。我们去找文件地址相对比较繁琐，一个简便的方法就是可以直接...
python如何注释一段代码_python如何注释
2020-11-25 19:37

weixin_39778668的博客我是多行注释1 我是多行注释2 我是多行注释3print(我上面的是多行注释)内容补充：以下实例我们可以输出函数的注释：def a():这是文档字符串passprint(a.__doc__)到此这篇关于python代码如何注释的文章就介绍到这了,...
python和matlab运行速度哪个快_MATLAB运行效率
2020-12-16 01:14

weixin_39751327的博客用过Matlab的人都知道，Matlab是一种解释性语言，存在计算速度慢的问题，为了提高程序的运行效率，matlab提供了多种实用工具及编码技巧。1. 循环矢量化Matlab是为矢量和矩阵操作而设计的，因此，可以通过矢量化方法...
没有解决我的问题, 去提问

码龄粉丝数原力等级 --

如何提高这段代码的运行速度？

3条回答默认最新

码龄粉丝数原力等级 --

如何提高这段代码的运行速度？

3条回答 默认 最新

3条回答默认最新