大数据量Mysql查询后经过循环使用python分片

1 问题描述：
（1）使用mysql查询基础数据，这里只有三四个基础的查询条件，联了一个表，同时有limit分页了；
（2）之后经过一系列逻辑处理，在这些处理中又包含了很多sql查询，而且是在第（1）条查询出来的结果基础上查询，以前是先分页的，第（1）一次只查询了十条，第二步最多循环十次，但是现在的新逻辑是，查询出来后，经过（2）的处理，不满足筛选条件的数据remove掉，然后再返回最后剩下的数据
（3）由于每一页都会remove()掉部分数据，我曾经尝试定义全局变量，记录删除数据，但是只能得到我当前查询这一页删除了多少，无法获取总共删除了多少，而且每一页的数量都不一定是10条，一般来说是10条以下（因为会删除部分不符合筛选条件的数据），但是要求是要获取满足筛选条件的总数据量，而且需要正常分页
（4）于是我不用limit分页，直接取全量数据，然后再记录删除的数据量，使用切片手动分页，就能获取总数据了，每页也都是10条，但是循环次数过多，数据量稍微大一点儿，就需要49秒左右
2 部分相关代码：
（1）基础查询：
SELECT op.order_id, opc.order_code, op.created_at AS create_time, opc.departure_date, opc.end_date, opc.company, opc.channel_id, opc.retail, opc.final_cost, opc.has_pay, opc.commission_price, opc.commission_type, opc.commission_value \ FROM order_product_customize AS opc \ LEFT JOIN order_product AS op ON opc.order_product_id = op.order_product_id \ WHERE { 0 } ORDER BY opc.created_at DESC { 1 }

(2) 手动分页：
nextPage = limit_start+page_size result['data_list'] = result['data_list'][limit_start:nextPage] result['total_num'] = result['total_num'] - self.delNum
3 报错信息：
没有报错，只是执行时间极其长
一台比较好的机器，执行时间为27.72秒，本地执行时间接近40秒，无法上传图片

4 已经尝试过的办法
（1）记录删除次数再减去（因为每次都只查一页，只能获取当前页删除的条数）
（2）取符合筛选条件的全量数据（数据量太大，又有循环，导致速度极其慢）
（3）每次查20条左右数据，然后获取没删除的前10条，记录最后一条的id（动态分页，无法获取每一页第一条数据,无法保证20条经过筛选后还能剩下10条）

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
DarkAthena ORACLE应用及数据库设计方案咨询师 2022-01-14 15:17
关注
三年前的问题。。。
看上去是一个数据分页的同时还要过滤的问题。
一般来说,数据量比较大的话,不建议查到应用内存里再进行过滤,应该在sql层面就直接把数据过滤掉,如果一个sql去过滤速度慢,那就分多个sql来过滤,必要时可以借用临时表。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python mysql查询数据量太大_MySQL Python查询大型数据库的时间太长
2021-01-20 03:43

行有恒堂的博客在(如果您的查询正在执行全表扫描，MySQL可以在找到第一行后停止它。如果找不到行，则完整表扫描必须运行到表的末尾。)这还避免了准备许多行返回给客户机，并在不需要的情况下将它们返回给客户机的开销。在另外，...
python 读取mysql大量数据处理_Python 频繁读取Mysql相关问题
2020-12-05 10:54

weixin_39981093的博客 1、需要频繁select大量数据，时间长、消耗内存大，如何解决mysql性能问题？如果对返回的结果数量没有要求，可以控制返回的数量：cursor.fetchmany(size=1000)这样是只返回1000条数据，如果返回的结果小于size，则...
python工具-excel批量导入mysql (几千万数据半小时可搞定)
2020-04-23 10:33

由于大数据量可能导致内存溢出，我们可以分批写入数据，比如每次处理10000行： ```python def batch_insert(connection, df, table_name, chunksize=10000): for chunk in df.iterrows(chunksize=chunksize): ...
【Python系列】Python 中使用 pymysql 连接 MySQL 数据库进行数据查询
2025-01-14 23:23

檀越@新空间的博客 pymysql 是一个纯 Python 编写的 MySQL 客户端库，它实现了 Python 数据库 API 规范（PEP 249），使得 Python...通过上述示例，我们可以看到使用 pymysql 在 Python 中连接 MySQL 数据库并执行数据查询操作的整个流程。
python 读取mysql大量数据处理,在python中读取巨大的MySQL表的最快方法
2021-03-01 17:07

weixin_39623350的博客 I was trying to read a very huge MySQL table made of several millions of rows. I have used Pandas library and chunks. See the code below:import pandas as pdimport numpy as npimport pymysql.cursorsconn...
【Python数据库操作】使用SQLite和MySQL进行数据存储和查询！
2024-10-19 14:44

萧鼎的博客在这篇博客中，我们深入探讨了如何在Python中使用SQLite和MySQL进行数据库操作。我们学习了如何创建数据库和表、插入、查询、更新和删除数据、使用ORM以及如何处理事务和异常。希望这些实用的技巧能帮助你在开发中...
使用Python查询Mysql中的数据
2021-02-23 16:06

Dancer-AI的博客 #第一步：连接到mysql数据库 conn = pymysql.connect(host='localhost' , user='root' , password='111111' , db='22222',charset="utf8") #第二步：创建游标对象 cursor = conn.cursor() #cursor当前的程序到数据...
Python入门：Python3 使用 mysql-connector 驱动操作 MySQL 数据库全面学习教程
2025-08-20 16:47

xcLeigh的博客 Python入门：Python3 使用 mysql-connector 驱动操作 MySQL 数据库全面学习教程，本文详细介绍了使用mysql-connector驱动在Python中操作MySQL数据库的方法。首先讲解了该驱动的安装及验证步骤，包括MySQL 8.0版本的...
使用Python进行数据库连接与操作SQLite和MySQL
2024-03-18 21:54

一键难忘的博客在现代应用程序开发中，与数据库进行交互是至关重要的一环。Python提供了强大的库来连接和操作各种类型的数据库，...本文将介绍如何使用Python连接这两种数据库，并进行基本的操作，包括创建表、插入数据、查询数据等。
python mysql大量update_Python 批量update MySQL数据库表某字段
2021-02-05 06:45

秦若逸的博客 .astype(str).tolist()[(i-1)]) conn.ping(reconnect=True) sqled= conn.query(sql) conn.commit() 采取了低效的for循环，有更好的方式欢迎告知，感谢~~ 还发现一个小问题，一个报错：1205 - Lock wait timeout ...
没有解决我的问题, 去提问

大数据量Mysql查询后经过循环使用python分片

1条回答 默认 最新

1条回答默认最新