Python解决嵌套for循环性能慢

两个json文件关联 其中文件file1次取500条关file2
关联得到结果500条记录

目前情况是file2数据总数大概十万左右 for循环嵌套关联效率极低

###代码：

import json

with open(file1,'r') as f1,open(file2,'r') as f2:
    a=json.load(f1)
    b=json.load(f2)
list_a=[]
for i in range(len(a)):
    for n in range(len(b)):
        if b[n]["id"]==a[i]["id"]:
             list_a.append(dict(b[n],**a[i]))
f3=open(result,'w') as f3
json.dump(list_a, f3,sort_keys=True, ensure_ascii=False)
f3.close()

###1000条关联7万数据大概是两分钟

file1 :

[
  {
    "id":"1",
    "name":"Tom"
 },
  {
    "id":"2",
    "name":"Jim"
 },
   {
    "id":"3",
    "name":"Bob"
 },
   {
    "id":"4",
    "name":"Jeny"
 },
   {
    "id":"5",
    "name":"Lara"
 },
  {
    "id":"6",
    "name":"Lin"
 },
   {
    "id":"7",
    "name":"Kim"
 },
   {
    "id":"8",
    "name":"Jack"
 },
   {
    "id":"9",
    "name":"Tony"
 }
]
``

##file2##

[
{
"id":"1",
"Details":[
{
"label":"jcc",
"hooby":"Swimming"
},
{
"label":"hkt",
"hooby":"Basketball"
},
]
},
{
"id":"2",
"Details":[
{
"label":"NTC",
"hooby":"Games"
}
]
},
{
"id":"3",
"Details":[
{
"label":"Nill",
"hooby":"BBQ"
},
{
"label":"hkt",
"hooby":"PAY"
},
]
},
{
"id":"4",
"Details":[
{
"label":"HFF",
"hooby":"Games"
}
]
},
{
"id":"5",
"Details":[
{
"label":"Make",
"hooby":"BBQ"
}
]
},
{
"id":"6",
"Details":[
{
"label":"LLL",
"hooby":"Games"
}
]
},
{
"id":"7",
"Details":[
{
"label":"mmm",
"hooby":"Games"
}
]
},
{
"id":"8",
"Details":[
{
"label":"nnn",
"hooby":"Games"
}
]
},
{
"id":"9",
"Details":[
{
"label":"yyy",
"hooby":"Games"
}
]
}
]

####
##预期结果:##

[
{
"id":"1",
"name":"Tom",
"Details":[
{
"label":"jcc",
"hooby":"Swimming"
},
{
"label":"hkt",
"hooby":"Basketball"
},
]
},
{
"id":"2",
"name":"Jim",
"Details":[
{
"label":"NTC",
"hooby":"Games"
}
]
},
{
"id":"3",
"name":"Bob",
"Details":[
{
"label":"Nill",
"hooby":"BBQ"
},
{
"label":"hkt",
"hooby":"PAY"
},
]
},
{
"id":"4",
"name":"Jeny",
"Details":[
{
"label":"HFF",
"hooby":"Games"
}
]
},
{
"id":"5",
"name":"Lara",
"Details":[
{
"label":"Make",
"hooby":"BBQ"
}
]
},
{
"id":"6",
"name":"Lin",
"Details":[
{
"label":"LLL",
"hooby":"Games"
}
]
},
{
"id":"7",
"name":"Kim",
"Details":[
{
"label":"mmm",
"hooby":"Games"
}
]
},
{
"id":"8",
"name":"Jack",
"Details":[
{
"label":"nnn",
"hooby":"Games"
}
]
},
{
"id":"9",
"name":"Tony",
"Details":[
{
"label":"yyy",
"hooby":"Games"
}
]
}
]

能不能把file1 map到一个里面然后只执行一次匹配

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
吃鸡王者 2019-03-29 17:21
关注
map肯定是没问题的
def deal（tmp）：
for i in b:
if i['id']==tmp['id']:
return dict(i,**tmp)
return None
map(deal,a)

如果b文件中没有id重复的数据，可在数据区陪后break 对b的循环这样也会减少很多无用的循环步骤。
同时对b的循环可以考虑用fiter来代替，可能会更好。
也可以考虑线程处理，也是很不错的一个方式。
最后建议对数据的处理尽量使用pandas库。

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python使用嵌套的for循环 python 有问必答
2022-05-30 12:45

回答 5 已采纳使用嵌套for循环： def print_numbers_triangle(number_of_rows): for i in range(1,number_of_rows+1):
python多层嵌套循环如何优化 python 后端开发语言
2022-03-05 22:27

回答 2 已采纳看的不是太明白，如果数据只能一条一条取，貌似只能尽量减少取无用数据的次数，以及通过多线程取数。如果数据是批量的，可以考虑用pandas 之类的进行计算。
python使用for嵌套的for循环 python 有问必答
2022-05-30 12:50

回答 2 已采纳 def get_sum_letter_freq(words_list, letter): num=0 for word in words_list: num+=word
Python语言基础：for循环嵌套.pptx
2022-05-03 11:46

for循环嵌套语法格式： for 取值 in 序列或迭代对象： for 取值 in 序列或迭代对象：语句块注：for语句可以嵌套任意类型的循环语句
Python嵌套for循环和二维列表的理解 python
2022-10-05 14:33

回答 2 已采纳第一个for是一个一个创建空列表的，当第一个for进入循环的时候创建了第一个空列表放入的arr里，arr就成了[[]]，然后进入第二个循环此时在第二个循环里i一直是0直到第二个循环结束，i就会变成i，
python两个for循环只有一个执行 python
2023-02-06 09:49

回答 4 已采纳 h是一个生成器对象，在python中，生成器对象中的数据通过for循环在取完里面所有的数据后，这是生成器对象的长度就变成了0，也就是里面没有数据了。所以后面的for循环就会什么数据也显示不出来。如果要
python for 循环与if语句相互嵌套 python
2022-03-16 10:45

回答 1 已采纳 1.因为是2重for循环如果a不清零，那a+=int(c)岂不是让它一直在暴增，它要把b的其中一项做累加，不是所有数字都累加到一起2.因为a累加之后可能比实际的值大，不能因为累加的过程中出现一个值刚好
python双重for循环太慢,Python:慢嵌套for循环
2021-04-27 03:42

simpson bill的博客我在四个嵌套的for循环中执行它，因为它需要大约O(n^4)次迭代，所以速度很慢。我一直想快点，但还是很慢。我的变量可能高达几千个。在下面是一个小例子，说明我要做的事情：max_disks = 5max_ssds = 5max_tapes = 1...
Python中for循环嵌套 python 有问必答
2023-04-04 14:00

回答 3 已采纳 python是以缩进来限定代码的作用范围的，缩进相同，表示同级代码，在你这个代码中，代码隶属关系如下：外层for循环从0到10遍历，下面的逻辑执行10次：内层for循环从0到10遍历，
如何提高嵌套for循环的效率 python 大数据有问必答算法
2022-04-16 10:58

回答 5 已采纳题主对问题的描述不清，比如：既然N1和N2是ndarray，直接给出它们的shape和dtype，简单明了。你这样描述了一大串，我还是不知道N1和N2各自是几维的，xi和yi究竟是数组还是整数还是浮
python，字典嵌套循环遍历合并问题 python
2023-03-09 13:01

回答 5 已采纳 new_dict = {} all_guests = {'Alice': {'apples': 5, 'pretzels': 12}, 'Bob': {'applse'
举例详解Python中循环语句的嵌套使用
2020-12-25 08:01

在Python中嵌套循环语句的语法如下： for iterating_var in sequence: for iterating_var in sequence: statements(s) statements(s) Python编程语言允许在一个循环内嵌套另一个循环。下面将介绍几个例子来...
python的嵌套循环输出 python
2023-04-22 19:18

回答 1 已采纳找到错误了：python的print默认为换行输出的，第18行又加了一个换行符，多了一行空格
Python for循环搭配else常见问题解决
2020-12-20 16:33

这篇文章主要介绍了Python for循环搭配else常见问题解决,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下假设有如下代码： for i in range(10): if i == 5: ...
python循环嵌套的多种使用方法解析
2020-09-18 08:58

主要介绍了python循环嵌套的多种使用方法解析,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
没有解决我的问题, 去提问

悬赏问题

¥15 HFSS 中的 H 场图与 MATLAB 中绘制的 B1 场部分对应不上
¥15 如何在scanpy上做差异基因和通路富集？
¥20 关于#硬件工程#的问题，请各位专家解答！
¥15 关于#matlab#的问题：期望的系统闭环传递函数为G(s)=wn^2/s^2+2¢wn+wn^2阻尼系数¢=0.707，使系统具有较小的超调量
¥15 FLUENT如何实现在堆积颗粒的上表面加载高斯热源
¥30 截图中的mathematics程序转换成matlab
¥15 动力学代码报错，维度不匹配
¥15 Power query添加列问题
¥50 Kubernetes&Fission&Eleasticsearch
¥15 報錯：Person is not mapped，如何解決？