Shiyimiao
shiyimiao
采纳率50%
2020-08-30 12:05

Python如何实现随机组合结果元组重复数量不能超过某个值?

50
已采纳

请各位高手指点思路,能附代码万分感谢!
1、现有Excel若干行(很多),每行都有不连续的整数组成(数量不定);
2、现需要在1-45中随机选取5个不重复的数,按从小到大排列;
3、要求:随机组合的结果中的元素与Excel每行元素重复数量不能超过4个(重复3个、2个、1个、0个)
4、输出所有符合要求的结果

图片说明

  • 点赞
  • 写回答
  • 关注问题
  • 收藏
  • 复制链接分享
  • 邀请回答

2条回答

  • jingluan666 jingluan666 7月前

    如果随机生成一个

    from random import randint, sample
    import pandas as pd
    
    excel = pd.read_excel(r"d:\test.xlsx")
    
    rows=excel.values #[]
    
    # for i in range(20):
    #     rows.append([randint(1,50) for _ in range(randint(10,30))])
    
    data = range(1,46)
    sampleCount=5
    
    def getSample(data):
        return sorted(sample(data, sampleCount))
    
    sp = getSample(data)
    
    while True:
        count=0
    
        for row in rows:
            same = list(set(sp).intersection(set(row))) #交集
    
            if len(same)>=4:
                sp = getSample(data)
                break
            else:
                count = count + 1
    
        if count == len(rows):
            break
    
    print(sp)
    

    所有可能

    
    from random import randint, sample
    import pandas as pd
    import itertools
    
    excel = pd.read_excel(r"d:\test.xlsx")
    
    rows=excel.values #[]
    
    # for i in range(20):
    #     rows.append([randint(1,50) for _ in range(randint(10,30))])
    
    data = range(1,11) #使用45求组合时很慢,这里用10个
    
    sampleCount=5
    
    pers = list(itertools.combinations(data, sampleCount)) #组合
    
    for per in pers:
        count=0
    
        for row in rows:
            same = list(set(per).intersection(set(row)))  # 交集
    
            if len(same) >= 4:
                break
            else:
                count = count + 1
    
        if count== len(rows):
            print(sorted(per))
    
    点赞 1 评论 复制链接分享
  • MFine MFine 7月前

    这样的问题,难易程度,完全取决于excel表中的数据。正向一一排除要难很多,逆向要容易些。

    逆向过程:
    1.最易情况: 如果有一行数据,包括1-45范围内其中的41 个数据,那么就不可能有这样组合。
    2.简单情况: 如果有一行数据,包括1-45范围内其中的35 个以上数据,那么这样组合,十分有限。也许有几百、几千种可能,再对它们逐行排除。
    3.一般情况:没有一行数据,包括1-45范围内25个以上数据,可能性非常多,逆向同样没效率。只能正向一一排除。

    正向过程:
    1-45取5个数,有1,221,759情况,建立个百万级的set表。
    每一行,读取数据,如果没有4个以上数值,落在1-45范围内,就不用管它。
    否则,就要把有冲突的情况,一一记录到本行的set表中,用前面的百万级set表,与它相差,就是真正可能的情况。
    这样逐行排除,前面百万级的set表剩下的,就是你要的。

    你懂得如何建立这个百万级的set表么?

    点赞 评论 复制链接分享