多标签分类模型循环问题

问题遇到的现象和发生背景

循环训练模型。我在循环训练模型的时候，随机打乱了训练数据，最后得到的结果都是一样的。我尝试单独运行5和10迭代次数，结果不一样。按理来说循环结果应该是不一样的，但是出现了结果完全相同的结果。

问题相关代码，请勿粘贴截图

# 随机选取训练集，并训练模型，并得到各个模型预测结果
def train_m(m):
    """
    :param m: 设置模型数目
    :return: 返回m个模型
    """
    model = {}  # 设置空的字典，用以存储模型或预测结果
    pred = {}
    i = 0
    while i < m:
        row_rand = np.random.permutation(train)  # 打乱数据顺序（使链排序为随机）
        row_rand_data = row_rand[..., 0:74]
        row_rand_label = row_rand[..., 74:134]

        # 训练模型，将所有模型存储在字典中
        clf = ClassifierChain(LGBMClassifier())
        clf_i = clf.fit(row_rand_data, row_rand_label)
        clf_i_copy = copy.copy(clf_i)
        model['%s'%i] = clf_i_copy

        # 预测，将所有预测结果存储在字典中，并将结果转换为数组toarray()
        pred_i = clf_i.predict(test_data).toarray()
        pred_i_copy = copy.copy(pred_i)
        pred['%s'%i] = pred_i_copy

        i = i + 1

    return model, pred

# 计算权重，得到最终预测结果
def w_pred_get(prediction_all, ft):
    w = prediction_all['0']
    num = 0
    i = j = 0
    # 统计预测标签数目
    while i < np.shape(prediction_all['0'])[0]:
        while j < np.shape(prediction_all['0'])[1]:
            for value in prediction_all.values():
                if value[i, j] == 1:
                    num = num + 1
            w[i, j] = num
            num = 0
            j = j + 1
        j = 0
        i = i + 1
    w = w/len(prediction_all) # 得到权值

    # 设置阈值ft，得到最终预测结果
    condition = w < ft
    condition2 = w >= ft
    prediction = np.where(condition, w, 1)
    prediction = np.where(condition2, prediction, 0)

    return prediction, w


# 查看不同迭代次数对于acc的影响，并进行可视化
for t in np.arange(5, 20, 5):
    model_it, pred_it = train_m(t)
    pred_w, w = w_pred_get(pred_it, 0.5)
    Subset_Accuracy = accuracy_score(pred_w, test_label)
    print(t, Subset_Accuracy)
    t = t + 5

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
herosunly 优质创作者: python技术领域 2022-07-29 10:30
关注
我先确认个问题哈，train的行现在的物理含义是什么？一般来说，行代表样本，列表示特征。但如果是这样的话就是不对的，对样本的顺序进行打乱以后并不会改变分类器的效果，这个是需要对列的顺序进行打乱。比如昨天帖子里的from skmultilearn.problem_transform import ClassifierChain，本质上是先根据x预测y1，然后再根据x、y1预测y2，以此类推，所以需要对y的顺序进行重排。所以您先确认一下行与列的物理含义对不对，如果是对的话，我再看看别的问题。

row_rand = np.random.permutation(train) # 打乱数据顺序（使链排序为随机） row_rand_data = row_rand[..., 0:74] row_rand_label = row_rand[..., 74:134]
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

为什么编程语言千变万化？理解其分类与核心要素
2025-05-29 18:14

Lion 莱恩呀的博客摘要： 编程语言种类繁多...代表性语言如Fortran（科学计算）、C（系统编程）、Java（跨平台）、Python（多领域开发）等，各具特色，适应不同需求。语言的发展始终围绕提高抽象层次、优化开发效率及适应技术变革展开。
一文读懂AI语言模型
2025-09-27 02:52

百锦再@新空间的博客文章重点分析了主流模型如GPT、BERT、T5等的特点，并提供了BERT情感分类的PyTorch微调代码示例。最后通过Hugging Face库演示了GPT-2文本生成实践，为读者提供了从理论到实践的完整学习路径，适合NLP研究者和开发者...
从零开始构建大语言模型（MEAP）
2024-04-29 01:46

绝不原创的飞龙的博客 LLM，即大型语言模型，是一种设计用于理解、生成和回应类似人类文本的神经网络。这些模型是在大量文本数据上训练的深度神经网络，有时包括互联网上整个可公开获取文本的大部分内容。"大型"语言模型中的"大"既指模型...
大型语言模型综述 A Survey of Large Language Models
2024-11-18 18:24

呈智文的博客文章源自这是一篇关于大语言模型（LLMs）的综述论文，主要介绍了 LLMs 的发展历程、技术架构、训练方法、应用领域以及面临的挑战等方面，具体内容如下：摘要 —— 自从图灵测试在 20 世纪 50 年代被提出以来，人类...
大语言模型与ChatGPT：深入探索与应用
2024-10-15 21:02

UnRuins的博客这篇博客的内容围绕大语言模型的工作原理、架构、应用、挑战及未来发展，旨在帮助读者全面了解ChatGPT等大语言模型的实际应用及其发展方向。
万字综述：大语言模型多智能体(LLM Multi-Agents)进展与挑战
2024-05-24 15:47

南七小僧的博客我们整理分享来自新加坡国立大学的最新论文：基于大型语言模型的多智能体综述- 进展与挑战, Large Language Model based Multi-Agents: A Survey of Progress and Challenges，文末有论文连接。大型语言模型（LLMs...
基础知识篇：大语言模型核心原理解析
2024-05-16 22:00

liuhenghui5201的博客人工智能（AI）是计算机科学的一个分支，旨在模拟人类的智能来解决问题。而机器学习（ML）是AI的一个子集，它的魅力在于。也就是说，我们不需要手动编写函数来告诉计算机如何执行任务，而是让计算机自行学习和迭代，...
大语言模型（LLM）综述
2024-10-07 21:26

SoaringPigeon的博客大语言模型综述
大语言模型LLM
2023-07-26 19:11

noobiee的博客 2020年1月，OpenAI发表了论文《Scaling Laws for Neural Language Models》，研究了基于交叉熵损失的语言模型性能的经验尺度法则，并且发现：大模型使用样本的效率显著更高，因此最优的高效训练方式是在中等数据集上...
数据标签化：如何通过标签化数据进行文本分类和自然语言处理自然语言处理教程
2023-07-18 00:42

光子AI的博客在自然语言处理中，词性标注、命名实体识别、句法分析、语义理解、语音合成、信息检索、文档摘要等功能需要对输入文本进行分析处理。这些任务通常都涉及到大量的数据处理工作。例如，给定一个文本序列（如一段话或一...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 7月29日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 7月29日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月28日

多标签分类模型循环问题

问题遇到的现象和发生背景

问题相关代码，请勿粘贴截图

3条回答 默认 最新

问题事件

3条回答默认最新