同样的代码，同样的数据量，为啥这个循环执行越来越慢？

有一个3十万条的字典表，导入sqlite，并且对前两个字段创建索引。步骤1

模拟创建了一个3百万条的记录，步骤2，想把这个表与步骤1中的字典表进行匹配，查询country的值

步骤3, 对步骤2中的3百万条记录的表进行遍历，每执行1万条记录，打印所需时间，为啥这个时间间隔越来越大？

import sqlite3
import time

connection=sqlite3.connect("aquaium.db")
cursor=connection.cursor()

cursor.execute("DROP table IF EXISTS ip_addr")
cursor.execute("create table ip_addr (start_ip integer,end_ip integer, country Text)")
# 1 创建的一个字典表,包含3十万条如下记录
'''
0,4，‘0A’
5,9,'5A'
......
'''
tmp=[]
i=0
ip_lst=[]
while(i<300000):
    ip_lst.append([i*5,i*5+4,str(i*5)+'A'])
    i+=1
print(len(ip_lst))
for a in ip_lst:
    tmp=[a[0],a[1],a[2]]
    cursor.execute("insert into ip_addr (start_ip,end_ip,country) values(?,?,?)",tmp)
connection.commit()
cursor.execute("create index index_ip on ip_addr(start_ip,end_ip)")

#2 创建一个3百万的list，其中的每个元素为一个列表。
'''
[0,'']
[1,'']
......
[3000000,'']

'''
myip=[]
i=0
while(i<3000000):
    myip.append([i,''])
    i+=1
print(len(myip))


#3 对上述3百万的列表进行遍历，依次从1中创建的字典表中检出‘country’的值， 每执行1万条查询，打印出所用
# 时间，为啥下面的这段循环进行起来越来越慢？？？？

i=0
start_time = time.time()
while(i<len(myip)):
    
    cursor.execute("select country from ip_addr where (%d >=start_ip  and %d<=end_ip)" %((i%300000),(i%300000)))
    test1=list(cursor.fetchone())
    if i%10000==0:
        print(i,test1)
        print("--- %s seconds ---" % (time.time() - start_time))
        start_time = time.time()
    i+=1

cursor.close()
connection.close()

下面是输出，为啥每次执行1万条查询的时间越来越大？3->7->10->14->18->22?

面

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

报告相同问题？

关注问题

python 处理数据越来越慢_Python运行效率慢？因为你不知道这六大窍门！
2020-12-05 10:56

weixin_39949607的博客尝试以下六个窍门，来为你的Python应用提速。窍门一：关键代码使用外部功能包Python简化了许多编程任务，但是对于一些时间敏感的任务，它的表现经常不尽人意。使用C/C++或机器语言的外部功能包处理...
掌握大数据领域 RabbitMQ 的消息队列容量规划
2025-05-27 17:08

光子AI的博客在大数据应用场景中，数据的产生和处理具有高并发、大规模和实时性的特点。RabbitMQ 消息队列可以有效地解决数据传输和处理过程中的各种问题，如系统间的耦合、流量峰值等。然而，不合理的消息队列容量规划可能导致...
大数据领域数据分析的人才需求与培养
2025-10-08 15:43

AI智能探索者的博客本文深入剖析了大数据领域数据分析人才的现状与未来需求，揭示了当前人才供需失衡的深层原因。通过详细解构数据分析岗位的技能体系，从技术能力、业务素养到软技能，全面阐述了现代数据分析人才的画像。文章重点探讨...
基于Spark在大数据领域实现数据可视化
2025-08-29 20:34

大厂资深架构师的博客 Spark作为一个快速、通用的集群计算系统，具有高效的分布式数据处理能力，能够处理大规模数据集。本文章的目的在于探讨如何利用Spark强大的数据处理能力，结合数据可视化技术，实现大数据的有效展示和分析。
大数据新视界 --大数据大厂之 Alluxio 数据缓存系统在大数据中的应用与配置
2024-10-02 21:15

青云交的博客 Alluxio 作为大数据中间层存储系统至关重要。本文阐述其架构、多存储支持特性。在应用方面，它加速数据访问（如缓存热门数据）、提高可靠性（副本管理）、保障安全（访问控制与加密），支持实时分析、优化数据湖架构...
五个篇章讲明白如何从0到1搭建大数据平台
2021-11-04 07:06

数据社的博客大家好，我是一哥，整理了一下之前写的搭建大数据平台的5个篇章，请大家收藏，文末可以获取完整PDF版本。01如何从0到1搭建大数据平台大数据时代这个词被提出已有10年了吧，越来越多的企业已经...
大数据技术原理与应用期末复习知识点全总结（林子雨版
2024-01-13 13:21

天玑y的博客信息化浪潮发生时间标志解决的问题代表企业第一次浪潮1980年前后个人计算机信息处理Intel、AMD、IBM、苹果、微软、联想、戴尔、惠普等第二次浪潮1995年前后...（1）兼容廉价的硬件设备（2）流数据读写（3）大数据集。
数据结构中遍历操作的非递归算法.pdf
2021-08-07 11:51

非递归算法代码较为复杂，但更加稳定，可控，尤其适用于大数据量的处理场景。总的来说，掌握非递归遍历算法对深化对数据结构的理解，以及提升在大数据背景下的编程能力和分析问题的能力都有重要作用。
建筑大数据分析与应用,建筑大数据技术与应用
2022-10-10 14:50

小浣熊的技术的博客发展趋势如下：随着科学技术和信息技术的高速发展，人类可居住的...改革开放以来，我国各方面的发展突飞猛进，如今我国的经济发展态势良好，人们的生活水平也越来越高，对生活质量和生活环境的要求也变得越来越高。随着
大数据新视界 --大数据大厂之 Apache Beam：统一批流处理的大数据新贵
2024-10-17 23:13

青云交的博客介绍了其批流处理统一模型，通过高度抽象管道操作融合批处理和流处理，窗口机制依据时间或数据量划分窗口。阐述编程模型与 API 优势，如 Java API 的特性。分析在大数据处理中的高效性、可扩展性及容错机制。以电商...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 8月4日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月27日

同样的代码，同样的数据量，为啥这个循环执行越来越慢？

0条回答 默认 最新

问题事件

0条回答默认最新