根据相似度最高的值对字典列表进行排序

Given the following python list of dictionaries:

results = [[{'id': '001', 'result': [0,0,0,0,1]},
           {'id': '002', 'result': [1,1,1,1,1]},
           {'id': '003', 'result': [0,1,1,None,None]},
           {'id': '004', 'result': [0,None,None,1,0]},
           {'id': '005', 'result': [1,0,None,1,1]},
           {'id': '006', 'result': [0,0,0,1,1]}],
          [{'id': '001', 'result': [1,0,1,0,1]},
           {'id': '002', 'result': [1,1,1,1,1]},
           {'id': '003', 'result': [0,1,1,None,None]},
           {'id': '004', 'result': [0,None,None,1,0]},
           {'id': '005', 'result': [1,0,None,1,1]},
           {'id': '006', 'result': [1,0,1,0,1]}]
            ]

I would like to generate a new sorted list (in both python and golang) based on the values of 'result' by comparing results between the players ('id') in each group and then sorting them based on the number of matching entries (None results are discarded and not counted):

During the first round and second round 001 and 006 had nine matching answers:
001 = [0,0,0,0,1] 006 = [0,0,0,1,1] - four matching answers.
During the second round, 001 and 006 had five matching answers:
001 = [1,0,1,0,1] 006 = [1,0,1,0,1] - five matching answers

sorted_results = ['001','006','002','005','003','004']

'001' and '006' are the first two items in the list because they have the highest number of matching results - nine.

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
duanjiaopi8218 2013-10-01 14:40
关注
If you sort those items by the "highest number of identical results", this is what you get:

['003', '004', '005', '006', '001', '002']

If you meant something else (i.e. not "highest number of identical results"), please clarify your question. Also, you can simply modify the max_identical function so that it acts according to your definition of similar.

The above result was computed with:

from collections import defaultdict results = [{'id': '001', 'result': [0, 0, 0, 0, 1]}, {'id': '002', 'result': [1, 1, 1, 1, 1]}, {'id': '003', 'result': [0, 1, 1, None, None]}, {'id': '004', 'result': [0, None, None, 1, 0]}, {'id': '005', 'result': [1, 0, None, 1, 1]}, {'id': '006', 'result': [0, 0, 0, 1, 1]}] def max_identical(lst): counts = defaultdict(lambda: 0) for x in lst: if x is not None: counts[x] += 1 return max(counts.values()) results = sorted(results, key=lambda x: max_identical(x['result'])) print [x['id'] for x in results]
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

如何用python实现根据图片内圈定内容给批量相似度极高的图片分类 python 人工智能有问必答机器学习
2021-05-30 12:34

回答 2 已采纳最简单是用opencv的特征提取，找一个样本的图片，提取特征，然后去其他图片里面匹配。
如何利用余弦相似度进行聚类 python
2019-04-24 17:37

回答 1 已采纳 sklearn里的k-means默认的欧氏距离改不了. 可以用Biopython这个包示例:https://blog.csdn.net/chenxjhit/article/details/803
文本相似度计算时需要对文件夹每一个文件分别计算 python
2023-02-23 15:13

回答 3 已采纳首先standardization(filename)函数，需要传入的的是一个文件路径，如下面代码的filename def standardization(filename): data='
Python 实现Jaccard 相似度 计算排序
2022-04-11 15:57

机器玄学实践者的博客基本原理 Jaccard 的核心就是。... 可以通过 jaccard 来根据我们的听歌的记录的交集和并集来计算相似度。如果我和我的朋友听过的歌完全一样，那么 fa = fb ， jaccard 为1。如果我们之间没有共同的播放
python中有两张表，怎么从第二张中匹配到第一张中分值最接近的值 python 排序算法
2022-01-17 19:43

回答 5 已采纳你的代码时间复杂度是2500000*500=1250000000，大概就是1e9,一般计算机目前每秒运算1e8左右。并且你的两重循环可以优化一下达到2500000+500，复杂度就是250万，完全可以
python如何求多个样本中两两样本之间的某个值 python 问答团队
2022-03-07 15:14

回答 1 已采纳程序大概结构如此，那个公式没看明白，就没写 # 把员工列表读入l , 可以用openxl 或者直接复制数据为列表 l = [n for n in range(1,8)] for i in r
三人用pathon做三观测试，通过集合比较三人三观的相似度 python
2022-11-03 02:08

回答 1 已采纳 import itertools as it choiceA = {'1Y', '2Y', '3Y', '4N', '5N', '6Y', '7Y', '8N', '9Y'} choiceB = {
python中文相似度_基于TF-IDF、余弦相似度算法实现文本相似度算法的Python应用
2020-11-24 11:00

weixin_39895283的博客基于TF-IDF算法、余弦相似度算法实现相似文本推荐——文本相似度算法，主要应用于文本聚类、相似文本推荐等场景。设计说明使用jieba切词，设置自定义字典使用TF-IDF算法，找出文章的...计算两个向量的余弦相似度，值...
python dataframe 相似的筛选语句结果不同 python
2021-04-22 17:07

回答 2 已采纳 Severity列是字符串类型，IR Status列却未必是。建议题主像下面的代码一样查看一下df.dtypes，确定IR Status列的类型。 >>> import pand
文本向量相似度不理想 bert python 深度学习
2023-04-14 09:28

回答 1 已采纳 BERT 是一种预训练语言模型，它的预训练目标是使用大量的未标记的文本数据来训练出语言表达能力更强的表示。但是，BERT 并不是一个直接用于文本相似度计算的模型，需要经过微调或 fine-tuning
用python实时检测电脑屏幕内与标准图标相似度85％以上的图像，输出屏幕相似图像的坐标怎么实现？ python 有问必答
2021-06-08 01:12

回答 2 已采纳可以用opencv的图像特征提取，然后确定图像在图片所在位置。具体可以参考一下：https://xyhuang.blog.csdn.net/article/details/80660688 如果
python关键词相似度_基于python语言使用余弦相似性算法进行文本相似度分析
2020-12-05 16:43

weixin_39566914的博客编写此脚本的目的：本人从事软件测试工作，近两年发现项目成员总会提出一些内容相似的问题，导致开发抱怨。一开始想搜索一下是否有...脚本进行相似度分析的基本过程：1、获取Bug数据。读取excel表，获取到“BugID”...
产生式系统python运行问题 python 人工智能有问必答
2021-10-14 19:34

回答 1 已采纳这句错误if name == 'main':，改成如下写法即可。 if __name__ == '__main__': 如对你有帮助，请采纳。点击我回答右上角【采纳】按钮。
python列表套着列表_Python列表集字典多列排序,python,套
2020-12-08 12:13

weixin_39718006的博客按照名称长短正序排列的话 “烨辰” 应该在 “意迪拉凯” 前面那我们该如何解决这个问题呢，Python中还封装了另一个好用的方法，就是“-”号排序。Like This： sorted(tm_list, key=lambda tm: (-tm["sm_type"], -...
Python比较文本相似度的7种方法（详细）
2020-07-20 15:47

SpinMeRound的博客 IDF模型对语料库建模 tfidf = models.TfidfModel(corpus) # 获取测试文档中，每个词的TF-IDF值 tfidf[doc_test_vec] # 3.2 对每个目标文档，分析测试文档的相似度 index = similarities.SparseMatrixSimilarity...
没有解决我的问题, 去提问

悬赏问题

¥20 测距传感器数据手册i2c
¥15 RPA正常跑，cmd输入cookies跑不出来
¥15 求帮我调试一下freefem代码
¥15 matlab代码解决，怎么运行
¥15 R语言Rstudio突然无法启动
¥15 关于#matlab#的问题：提取2个图像的变量作为另外一个图像像元的移动量，计算新的位置创建新的图像并提取第二个图像的变量到新的图像
¥15 改算法，照着压缩包里边，参考其他代码封装的格式写到main函数里
¥15 用windows做服务的同志有吗
¥60 求一个简单的网页(标签-安全|关键词-上传)
¥35 lstm时间序列共享单车预测，loss值优化，参数优化算法

根据相似度最高的值对字典列表进行排序

2条回答 默认 最新

悬赏问题

2条回答默认最新