黑猫不睡1920 2019-03-28 20:57 采纳率: 100%
浏览 8571
已结题

Python解决嵌套for循环性能慢

两个json文件关联 其中文件file1次取500条关file2
关联得到结果500条记录

目前情况是file2数据总数大概十万左右 for循环嵌套关联效率极低

###代码:

import json

with open(file1,'r') as f1,open(file2,'r') as f2:
    a=json.load(f1)
    b=json.load(f2)
list_a=[]
for i in range(len(a)):
    for n in range(len(b)):
        if b[n]["id"]==a[i]["id"]:
             list_a.append(dict(b[n],**a[i]))
f3=open(result,'w') as f3
json.dump(list_a, f3,sort_keys=True, ensure_ascii=False)
f3.close()

###1000条关联7万数据大概是两分钟

file1 :

[
  {
    "id":"1",
    "name":"Tom"
 },
  {
    "id":"2",
    "name":"Jim"
 },
   {
    "id":"3",
    "name":"Bob"
 },
   {
    "id":"4",
    "name":"Jeny"
 },
   {
    "id":"5",
    "name":"Lara"
 },
  {
    "id":"6",
    "name":"Lin"
 },
   {
    "id":"7",
    "name":"Kim"
 },
   {
    "id":"8",
    "name":"Jack"
 },
   {
    "id":"9",
    "name":"Tony"
 }
]
``

##file2##

[
{
"id":"1",
"Details":[
{
"label":"jcc",
"hooby":"Swimming"
},
{
"label":"hkt",
"hooby":"Basketball"
},
]
},
{
"id":"2",
"Details":[
{
"label":"NTC",
"hooby":"Games"
}
]
},
{
"id":"3",
"Details":[
{
"label":"Nill",
"hooby":"BBQ"
},
{
"label":"hkt",
"hooby":"PAY"
},
]
},
{
"id":"4",
"Details":[
{
"label":"HFF",
"hooby":"Games"
}
]
},
{
"id":"5",
"Details":[
{
"label":"Make",
"hooby":"BBQ"
}
]
},
{
"id":"6",
"Details":[
{
"label":"LLL",
"hooby":"Games"
}
]
},
{
"id":"7",
"Details":[
{
"label":"mmm",
"hooby":"Games"
}
]
},
{
"id":"8",
"Details":[
{
"label":"nnn",
"hooby":"Games"
}
]
},
{
"id":"9",
"Details":[
{
"label":"yyy",
"hooby":"Games"
}
]
}
]

####
##预期结果:##

[
{
"id":"1",
"name":"Tom",
"Details":[
{
"label":"jcc",
"hooby":"Swimming"
},
{
"label":"hkt",
"hooby":"Basketball"
},
]
},
{
"id":"2",
"name":"Jim",
"Details":[
{
"label":"NTC",
"hooby":"Games"
}
]
},
{
"id":"3",
"name":"Bob",
"Details":[
{
"label":"Nill",
"hooby":"BBQ"
},
{
"label":"hkt",
"hooby":"PAY"
},
]
},
{
"id":"4",
"name":"Jeny",
"Details":[
{
"label":"HFF",
"hooby":"Games"
}
]
},
{
"id":"5",
"name":"Lara",
"Details":[
{
"label":"Make",
"hooby":"BBQ"
}
]
},
{
"id":"6",
"name":"Lin",
"Details":[
{
"label":"LLL",
"hooby":"Games"
}
]
},
{
"id":"7",
"name":"Kim",
"Details":[
{
"label":"mmm",
"hooby":"Games"
}
]
},
{
"id":"8",
"name":"Jack",
"Details":[
{
"label":"nnn",
"hooby":"Games"
}
]
},
{
"id":"9",
"name":"Tony",
"Details":[
{
"label":"yyy",
"hooby":"Games"
}
]
}
]


能不能把file1 map到一个里面然后只执行一次匹配

  • 写回答

2条回答

  • 吃鸡王者 2019-03-29 17:21
    关注

    map肯定是没问题的
    def deal(tmp):
    for i in b:
    if i['id']==tmp['id']:
    return dict(i,**tmp)
    return None
    map(deal,a)

    如果b文件中没有id重复的数据,可在数据区陪后break 对b的循环这样也会减少很多无用的循环步骤。
    同时对b的循环可以考虑用fiter来代替,可能会更好。
    也可以考虑线程处理,也是很不错的一个方式。
    最后建议对数据的处理尽量使用pandas库。

    评论

报告相同问题?

悬赏问题

  • ¥15 HFSS 中的 H 场图与 MATLAB 中绘制的 B1 场 部分对应不上
  • ¥15 如何在scanpy上做差异基因和通路富集?
  • ¥20 关于#硬件工程#的问题,请各位专家解答!
  • ¥15 关于#matlab#的问题:期望的系统闭环传递函数为G(s)=wn^2/s^2+2¢wn+wn^2阻尼系数¢=0.707,使系统具有较小的超调量
  • ¥15 FLUENT如何实现在堆积颗粒的上表面加载高斯热源
  • ¥30 截图中的mathematics程序转换成matlab
  • ¥15 动力学代码报错,维度不匹配
  • ¥15 Power query添加列问题
  • ¥50 Kubernetes&Fission&Eleasticsearch
  • ¥15 報錯:Person is not mapped,如何解決?