关于模型泛化性的问题？

**关于模型的泛化性有一个疑问。
首先，我有三个数据集，分别为a，b，c，然后模型是以a为目标进行搭建的，
a，b，b数据集全都进行了划分，每个数据集均分为：训练集，测试集，验证集 8：1：1，
通过模型，a数据集训练-测试后的结果为90%，b训练-测试后的结果为95%，c训练-测试后结果为87%，
模型面对三个数据集均进行了重新训练然后以对应的测试集进行测试，这样做是否能说明模型的鲁棒性与泛化性？

还是说用a数据集训练完模型，用b数据集或者c数据集直接取一部分进行测试，才能说明模型泛化性鲁棒性？**

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN-Ada助手 CSDN-AI 官方账号 2023-06-27 14:47
关注
你可以参考下这个问题的回答, 看看是否对你有帮助, 链接: https://ask.csdn.net/questions/771208
除此之外, 这篇博客: 2020华数杯C题脱贫帮扶绩效评价你怕了吗？中的问题二：160 个帮扶单位帮扶着基础不同的村庄，帮扶单位帮扶工作的态度、目标、投入、帮扶干部素质等显然是有差异的。仅仅用 2020 年各村庄评分高低显然是无法真正有效的体现一个帮扶单位在脱贫攻坚提升方面所做出的努力。请你运用附件的数据，阐明什么类型的帮扶单位，哪些帮扶单位在脱贫帮扶上面有较高的绩效？请给不同类型的帮扶单位绩效排序，给出脱贫帮扶绩效前十名的帮扶单位编号。部分也许能够解决你的问题, 你可以仔细阅读以下内容或跳转源博客中阅读:
基本思路是：构造指标-计算各指标的权重-TOPSIS法进行评价
为了有效凸显出五年来帮扶单位在脱贫攻坚提升方面所作出的努力，计算了各指标的增长率，即
2020_SR/2015_SR,2020_CY/2015_CY,……,2020_ZF/2015_ZF
主成分分析法是一种线性无监督的降维方法，可以通过主成分分析法计算各指标方差贡献率，以此作为各指标的权重。接着采用TOPSIS法进行评价，TOPSIS法是一种常用的组内综合评价方法，能充分利用原始数据的信息，其结果能精确地反映各评价方案之间的差距。基本过程为基于归一化后的原始数据矩阵，采用余弦法找出有限方案中的最优方案和最劣方案，然后分别计算各评价对象与最优方案和最劣方案间的距离，获得各评价对象与最优方案的相对接近程度，以此作为评价优劣的依据。该方法对数据分布及样本含量没有严格限制，数据计算简单易行。

#构造评价指标 data_2 = pd.DataFrame(data.pivot_table(index=['帮扶单位(0-159)','村庄编号','帮扶单位类型（0-5)'],values=columns)).reset_index() for j in range(6): data_2['{}_增长率'.format(j)] = data_2.iloc[:,9+j]/data_2.iloc[:,j+3] data_2 = data_2.drop(['帮扶单位(0-159)','村庄编号','帮扶单位类型（0-5)'],axis=1).drop(columns,axis=1) c = ['CY_增长率','HJ_增长率','SR_增长率','SS_增长率','WJ_增长率','ZF_增长率'] data_2.columns = c # 数据归一化 def Standard(data): return (data - data.min())/(data.max()-data.min()) data_2 = Standard(data_2) # PCA计算指标权重 from sklearn.decomposition import PCA from sklearn import preprocessing pca = PCA(n_components=6) pca.fit_transform(data_2) weight = pca.explained_variance_ratio_ #方差贡献率 print(weight) def topsis(data, weight): # 最优最劣方案 Z = pd.DataFrame([data.min(), data.max()], index=['负理想解', '正理想解']) # 距离 Result = data.copy() Result['正理想解'] = np.sqrt(((data - Z.loc['正理想解']) ** 2 * weight).sum(axis=1)) Result['负理想解'] = np.sqrt(((data - Z.loc['负理想解']) ** 2 * weight).sum(axis=1)) # 综合得分指数 Result['综合得分指数'] = Result['负理想解'] / (Result['负理想解'] + Result['正理想解']) Result['排序'] = Result.rank(ascending=False)['综合得分指数'] return Result results = topsis(data_2,weight) results['帮扶单位(0-159)'] = data['帮扶单位(0-159)'] results['帮扶单位类型（0-5)'] = data['帮扶单位类型（0-5)'] results.sort_values(by='排序').head(10)

以下回答由chatgpt基于相关博客总结生成:
答案：

首先需要理解模型的泛化性和鲁棒性。泛化性是指模型不仅在训练集上表现好，在测试集和新数据上也能表现良好；鲁棒性是指模型对于不同的数据或数据采集方式的变化具有稳定的分析和预测能力。

在这个问题中，模型是以a数据集为目标进行构建的，因此在a数据集上表现最好是可以预期的。但对于b和c数据集，模型的泛化性和鲁棒性需要通过重新训练模型来验证。因此，在b和c数据集上重新训练模型，并在同样的测试集上进行测试，可以更全面地评估模型的泛化性和鲁棒性。

具体解决方案如下：

1.准备数据集

将a、b、c数据集都按照8:1:1的比例划分为训练集、验证集和测试集。

2.训练模型

使用a数据集训练模型，得到训练-测试的准确率为90%。

使用b数据集重新训练模型，得到训练-测试的准确率为95%。

使用c数据集重新训练模型，得到训练-测试的准确率为87%。

3.在测试集上进行测试

针对每个数据集，都使用相应的测试集来测试模型，并得到相应的测试准确率。

4.评估模型的泛化性和鲁棒性

综合以上测试结果，可以更全面地评估模型在不同数据集上的泛化性和鲁棒性，以确定模型是否具有稳定的分析和预测能力。

如果模型在不同数据集上的测试准确率都很高，且相差不大，那么可以说明该模型具有很好的泛化性和鲁棒性。

如果模型在不同数据集上的测试准确率相差很大，那么需要进一步探究原因并改进模型。

综上所述，只有用a数据集训练完模型，然后用b数据集或c数据集取一部分进行测试，是不能完全说明模型的泛化性和鲁棒性的。需要对不同数据集都重新训练模型，并在相应的测试集上进行测试，才能更全面地评估模型的泛化性和鲁棒性。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

如何提高NLP模型鲁棒性和泛化能力？对抗训练论文综述.rar
2023-10-18 17:39

3. **问答系统**：增强模型对误导性问题的辨别力，提高回答质量。 4. **情感分析**：对抗训练有助于模型理解语境，准确识别微妙的情感变化。六、未来研究方向尽管对抗训练已取得一些进展，但仍有诸多挑战，如...
AI模型的泛化性的第一性原理是什么？
2025-06-12 11:04

mao_feng的博客 AI模型中的泛化性（Generalization）指模型在未见过的数据上保持预测准确性的能力，其第一性原理（即最根本的驱动机制）可归结为模型对数据生成规律的本质性学习与复杂度控制。以下结合理论框架与实现机制展开分析：...
泛化能力与人工智能：如何提高AI模型的泛化性能
2024-01-07 02:40

光子AI的博客 人工智能（Artificial Intelligence, AI）是一门研究如何让计算机模拟人类智能的学科。在过去的几十年里，人工智能研究已经取得了很大的进展，包括自然语言处理、计算机视觉、机器学习等领域。然而，人工智能系统...
模型优化_如何提高网络/模型的泛化能力？(全面)
2024-02-29 22:30

惊鸿一博的博客提高神经网络的泛化能力。
当前大模型Agent能力面临的最大挑战是泛化性不足？
2025-09-05 16:17

Agent加载失败的博客这就涉及到一个根本性问题：人类智能的本质到底是什么？
【强化学习解惑】强化学习模型泛化性差的原因是什么，如何提高泛化能力？
2025-07-24 22:52

云博士的AI课堂的博客强化学习模型泛化性差的原因是什么，如何提高泛化能力？
深度剖析 AI 大模型泛化能力原理
2025-04-28 08:30

Android 小码峰啊的博客泛化能力是衡量一个 AI 模型优劣的关键...AI 大模型的泛化能力是衡量其在实际应用中有效性的关键指标。本文深入剖析了影响泛化能力的多个因素，包括数据因素、模型结构因素、训练方法因素以及评估指标与验证方法等。
为什么说大模型才有泛化能力？小模型做不到的事，提示词也救不了
2025-07-12 13:18

之之为知知的博客泛化能力，就是模型在面对从未见过的数据或任务时，依然能做出合理判断和回应的能力。换句话说，就是一个模型能不能“举一反三”。
模型的鲁棒性和泛化性
2025-03-10 12:15

临风、的博客指的是模型对于输入数据的健壮性，即模型在遇到各种不同的数据输入时，仍然能够保持高效的表现。一个鲁棒性强的模型能够在...一个具有很强泛化性的模型能够在不同的数据集上都表现出色，而不仅仅是在训练集上表现好。
中国AI大模型发展白皮书
2023-09-01 15:42

随着数字化转型需求增长，AI在企业中的应用也越来越多，AI开发门槛高、应用场景复杂多样、对场景标注数据依赖等问题成为AI规模化落地的挑战，而预训练大模型的出现则为人工智能带来了新的机遇与希望。大模型作为政府...
2023AI大模型市场研究报告，迈向通用人工智能，大模型拉开新时代序幕
2023-08-17 18:21

《2023AI大模型市场研究报告：迈向通用人工智能，大模型引领新时代》随着人工智能领域的飞速进步，特别是计算能力和深度学习技术的不断提升，大模型已成为AI领域的一个重要里程碑。大模型，即拥有数百万乃至数十亿...
关于深度学习模型泛化问题的一些思考
2021-11-10 17:35

shour_744的博客 1、假设只有一个source domain的训练数据，那么训练时就会存在一个精度与泛化能力之间平衡的问题精度是要求在source ...2、一般解决模型泛化的方案有2个，transfer learning 以及domain adaptation (CycleGAN - b
大模型泛化能力揭秘：从死记硬背进化到举一反三、触类旁通！
2025-09-05 15:30

AI大模型入门学习教程的博客大模型泛化能力是指AI从死记硬背进化到举一反三、触类旁通的能力。其底层逻辑在于通过统计学习在高维空间中捕捉模式，通过损失函数最小化学习鲁棒特征，构建层次化抽象表示。具体表现为指令、任务、语言和推理泛化。...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 6月27日

关于模型泛化性的问题？

1条回答 默认 最新

问题事件

1条回答默认最新