这个代码效率太低，有什么方法让效率高点吗

代码

import pandas as pd
import openpyxl as op
data_a = pd.read_excel('a1.xlsx')
data_b = pd.read_excel('B1.xlsx')


#count_if函数 
def countif(line, base1, base2, base3, base4, count_column):
   line['cnt_if'] = sum(line[count_column] == base1 )+sum( line[count_column] == base2)+sum( line[count_column] == base3)+sum( line[count_column] == base4)
   return line

#将count_if应用到每一行
wb = op.load_workbook( "B1.xlsx" )
sh=wb[ "Sheet1" ]
for item in data_b.index:  #获取行坐标
   count = 0 # 统计置零
   for i in range( 1,5 ):  #获取列坐标
      col_name ="Y"+str(i) #生成列名
      data_loc = data_b.loc[item, col_name] #定位数据坐标
      # 给对比参数赋值
      if col_name == 'Y1':
         Y1=data_loc
      elif col_name == 'Y2':
         Y2=data_loc
      elif col_name == 'Y3':
         Y3=data_loc
      else:
         Y4=data_loc
   # 数据对比
   new_df = data_a.apply(countif, axis=1, args=( Y1, Y2, Y3, Y4, ['X1', 'X2', 'X3', 'X4','X5'] ))
   count_tmp = sum(new_df['cnt_if'] == 4) # 统计每行相同数出现 4次的数量
   if count_tmp > 0 :
      count  = count+count_tmp
   print(count) #----
   # 结果写入excel
   sh.cell( item+2,7,count ) #写入表指定单元格

wb.save("B1.xlsx")        #写入excel文件

这个代码效率太低，统计20万条数据要几个小时，有什么方法让效率高点吗？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
请叫我问哥 Python领域新星创作者 2023-01-02 17:54
关注
20万条数据。。。一般都会使用数据库吧
另外使用pandas可以直接读取excel，为什么还要使用openpyxl呢？

解决
无用 1
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

数据库设计的效率问题数据库
2018-03-05 08:40

回答 7 已采纳个人感觉可以放在一起，该表中“小区”和房屋情况没有合适的外键连接；且在今后的查询等操作中，就算两个表之间有外键，表的连接操作也会花费较多时间。利用范式分开表主要目的是为了解决数据冗余，提高存储
到底什么是量化策略所谓的量化到底是什么 python
2022-05-07 09:37

回答 1 已采纳个人观点。先说结论：如果你现在的策略可以挣钱，且你有渠道获得即时数据和交易接口，且有几千万，那么量化交易是有用的，否则毫无意义。1、通过量化模型（交易策略）可以是根据概率论，统计学等方式建立，大概可以
做深度学习，目标检测，选择什么显卡？ python 目标检测
2023-03-20 16:27

回答 3 已采纳看你除了深度学习外还有没有其他需求，比如打游戏之类的。游戏的话ti还是好一些（3060Ti带2K144中画质没啥问题，3060吃力一些，帧数少个10来帧影响不是很大，不是人人都是人眼鉴帧器，优化好的游
爱了，这篇Java并发编程技术点总结的太详细了
2024-04-22 10:45

2401_83916394的博客指令重排序分两类：编译器重排序和运行时重排序 JVM在编译Java代码或者CPU执行JVM字节码时，对现有的指令进行重新排序，主要目的是优化运行效率(不改变程序结果的前提)举例： int a = 3 //第一步 1 int b = 4 /...
8500预算，怎么配置一个台式机硬件工程
2022-06-19 10:27

回答 1 已采纳建议去百度贴吧图拉丁吧询问
MybatisPlus 怎么提高sql性能 java 性能优化数据库
2022-08-09 20:20

回答 1 已采纳 1.对条件字段加索引2.条件列尽量不要用函数3.如果数据库特别大可以考虑按时间分区分表
一个关于List去重并叠加的问题 java java-ee
2019-11-22 16:54

回答 2 已采纳 ``` List table; Map map = new LinkedHashMap(); for (Goods good : list) {
20个让你效率更高的CSS代码技巧
2019-08-25 16:22

张miro的博客在这里想与你分享一个由各大CSS网站总结推荐的20个有用的规则和实践经验集合。有一些是面向CSS初学者的，有一些知识点是进阶型的。希望每个人通过这篇文章都能学到对自己有用的知识。 1、注意外边距折叠与其他...
python时间复杂度为O(nlog2n)的算法 python 数据结构
2022-06-02 16:51

回答 1 已采纳归并排序
Oracle 两句SQL 比较效率数据库
2009-12-21 21:09

回答 3 已采纳取决于你的索引是建立在p_usefullife上还是to_char(p_usefullife,'yyyy-mm-dd')上。如果没有索引的话，理论上是第一个效率高，但是讨论那点儿差别，就好比讨论你
如何从PHP中的正弦波数据阵列获得高点和低点 php
2016-08-31 13:11

回答 1 已采纳 Maybe this works better for your problem. //example data $result_obj = array( ['v'=>1],['v'=&g
领导嫌开发效率低，咋办？
2021-08-17 13:47

程序员干货站的博客阅读本文大概需要2min文/强哥，图/强哥未经授权禁止转载作为一个技术leader，经常会被老板问的一个问题就是：团队效率还能再高点吗？有时可能是面临一些高优先级的项目，排期紧；有时...
.net/mysql相关，执行更新插入时的优化方法 sql
2017-12-13 06:27

回答 2 已采纳本质上，在底层，更新操作也是删除+插入新字段实现的，只是数据库底层完成的，并且原子化了。所以你写一个存储过程，把判断插入和修改放在里面，被主程序调用，就是最高效的了。
【CodeWave 智能开发平台探密】聚浪成潮，实现业务数智化皆可低代码
2023-12-27 09:55

完美句号的博客 CodeWave智能开发平台”全面融合了结合了低代码和AIGC两大核心技术，实现了软件研发的全链路，从软件的设计开发、测试、运维、运营全链路全智能的覆盖，以让软件生产更简单、更高效、更智能的宗旨，实现了软件开发的...
一个故事告诉你，学习编程是否需要天赋？
2024-04-20 04:45

2401_84407849的博客以上是摘自百度百科对“天赋”一词的解释，其实说真的，我就觉得，天赋这个玩意有点玄学的感觉，着实让人摸不着头脑，觉得云里雾里，不知道天赋是个什么东西！那我就简单点说！有句话是这么说的，实现梦想没有...
【面经】2024春招-后端开发工程师2（三大行 & TW等）
2024-04-20 12:03

小哈里的博客【面经】2024春招-云计算后台研发工程师2（三大行 & TW等）文章目录岗位与面经基础1：数据库 & 网络基础2：系统 & 网络编程模板3：算法 & 行测岗位与面经 1、银行面经（重点）
C语言是什么，花十分钟彻底搞清楚!
2024-06-11 20:41

数据结构和算法教程（C语言版）的博客在 2023 年 10 月份发布的世界编程语言排行榜中，C 语言拿了一个第二名的好成绩，占据了 12.08% 的市场份额。这些底层知识决定了你的发展高度，也决定了你的职业生涯。如果你希望成为出类拔萃的人才，而不仅仅是码农...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月2日

悬赏问题

¥15 封装的 matplotlib animation 不显示图像
¥15 python摄像头画面无法显示
¥15 关于#3d#的问题：d标定算法(语言-python)
¥15 cve，cnnvd漏洞扫描工具推荐
¥15 图像超分real-esrgan网络自己训练模型遇到问题
¥15 如何构建全国统一的物流管理平台?
¥100 ijkplayer使用AndroidStudio/CMake编译，如何支持 rtsp 直播流?
¥15 用js遍历数据并对非空元素添加css样式
¥15 使用autodl云训练，希望有直接运行的代码(关键词-数据集)
¥50 python写segy数据出错

这个代码效率太低，有什么方法让效率高点吗

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新