用列表1(set集合) 匹配 列表2内元素(有重复元素),然后将列表1内每个元素对应列表2的索引集合组合成字典,但我发现一但·行数达到几十万条时后,匹配效率太低,匹配次数为len(列表1)*len(列表2).,,请问下有各位老大没有什么好的方法提升效率,或者有没有其他实现方法,怎么实现或者修改?。下面举个栗子:
def CellIndexDict(cells,cell_list):
"""根据cells列表内的清单,匹配出cell_list列表内所在的索引,制成字典{cell:[indexhub]}
"""
allcellindexDict={}
for c in cells:
indexlist=[i+1 for i,v in enumerate(cell_list) if v==c]
allcellindexDict[c]=indexlist#单个小区索引集合
return allcellindexDict
cells=["a","aa","aaa","b","bb","bbb","c","cc","ccc"]
cell_lists=["a","aa","aaa","b","bb","bbb","c","cc","ccc"]*1000000