关于验证集准确率和预测结果不同的问题

各位大佬，我遇到了这样一个问题。

我训练了一个图像分类的模型，训练集2062张图片，验证集517张图片。

训练过程中，验证集准确率最高达到了0.733。

但是我用得到的模型对验证集中的图片一张张进行预测，517张图只有199张得到了正确结果，也就是不到0.4的准确率。

请问这是为什么呢，求大佬解答。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
你知我知皆知 2024-07-23 20:47
关注
以下回答参考 皆我百晓生、券券喵儿 等免费微信小程序相关内容作答，并由本人整理回复。

这个问题可能有多种原因，以下是一些可能的原因：

数据不平衡：如果在训练集和验证集中数据分布不均衡，那么可能会导致模型倾向于处理更多数量的数据类别。在这种情况下，使用更少但质量更好的样本来测试模型可能会更好。

模型过拟合：如果你的模型在训练时过于依赖于特定的数据点或模式，它可能会在新的数据上表现不佳。这可能是由于你没有足够的数据来覆盖所有可能的情况。

特征选择不当：如果你的特征选择不当，你的模型可能会专注于错误的特征，而忽略了更重要的特征。例如，如果你只使用颜色作为特征，而忽略形状、纹理等其他特征，那么你的模型可能会将图像分为不同的类别的概率较高，但实际上这些类别之间并没有显著的差异。

正则化参数设置不当：如果你的正则化参数设置得不合适，你的模型可能会过度拟合训练数据，而在新数据上表现不佳。

为了解决这些问题，你可以尝试以下方法：

评估数据分布是否平衡，并尝试增加数据量以改善不平衡。
使用交叉验证或其他技术来检查模型的表现，确保模型不会过度拟合并泛化到新数据。
使用特征选择技术，比如主成分分析（PCA）或者LASSO回归等，来选择重要的特征。
调整正则化参数，使得模型能够更好地避免过拟合。

请注意，以上建议都需要根据具体情况进行调整，因此最好先尝试各种方法并观察效果，然后再决定下一步如何改进。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

验证集准确率先波动再上升最后高于训练集准确率 的原因
2024-08-22 20:08

小小星125的博客：模型在训练集上没有充分收敛可能是学习率、正则化等参数的影响，导致模型对训练数据的拟合不足，验证集准确率因而表现得更好。：验证集小导致的随机性会引起较大的波动，但当模型在验证集中逐渐表现出更稳定的性能...
关于ai准确率问题
2025-05-03 12:48

产品老王的博客例如，当K = 5时，数据集被分为5个子集，依次将每个子集作为测试集，用其余4个子集训练模型，这样可以得到5个模型和对应的评估结果，通过平均这些结果，可以更稳定和可靠地评估模型的性能，避免因数据集划分的随机性...
验证集准确率上不去_经验之谈｜处理不平衡数据集的7个技巧
2020-12-03 18:58

weixin_39540934的博客 Rick Radewagen编译：ronghuaiyang介绍具体的领域中的数据集是什么样的，银行中的欺诈检测，市场中的实时投标，网络中的入侵检测，常见吗？这些领域中的数据，常常只有不到1%的少数，但是“有兴趣”的事件(如信用卡...
【问题解决】训练和验证准确率很高，但测试准确率很低
2022-08-09 06:13

ifsun-的博客采用ResNet50预训练模型训练自己的图像分类模型。训练和验证阶段准确率很高，但随机输入一张图片时，大多数情况下依旧预测得不准确。
pytorch计算验证集上的准确率
2024-09-07 15:16

浩瀚之水_csdn的博客这些预测结果可能是分类任务的类别索引，回归任务的连续值（尽管在计算准确率时，回归任务的预测值通常会通过某种方式转换为分类标签），或者其他形式的输出，但在这里我们假设它是分类任务的类别索引。综上所述，这...
【人工智能机器学习基础篇】——深入详解监督学习之模型评估：掌握评估指标（准确率、精确率、召回率、F1分数等）和交叉验证技术
2024-12-30 09:35

猿享天开的博客【人工智能机器学习基础篇】——深入详解监督学习之模型评估：掌握评估指标（准确率、精确率、召回率、F1分数等）和交叉验证技术
人工智能车牌识别数据集
2022-10-05 10:36

"人工智能车牌识别数据集"是为训练和优化AI模型而专门准备的一系列图像和相关数据，这些数据集通常包括训练集、测试集和验证集，以确保模型在不同阶段的性能评估。训练集是用于教授AI模型识别车牌的基础，其中包含...
【每天一个AI小知识】：什么是训练集、验证集及测试集？
2025-11-12 19:29

海边夕阳2006的博客机器学习模型开发中的数据划分艺术在AI模型训练中，合理划分数据集是确保模型性能的关键。通常将数据分为三个独立部分：训练集（70-90%）：模型"学习课本"，通过大量练习掌握基本能力 验证集（10-15%）...
Resnet50 验证集的准确率很低
2022-03-08 21:20

Ting_?的博客 (28条消息) 训练模型的准确率很高，但是验证集准确率特别低_bi_diu1368的专栏-CSDN博客_训练集准确率高,测试集准确率低 2.增加验证集比率。因为这里我训练集大概占比8：1，似乎不是很合理。 3.bn层.
使用resnet， inception3进行fine-tune出现训练集准确率很高但验证集很低的问题
2020-10-03 21:49

datayx的博客向AI转型的程序员都关注了这个号????????????机器学习AI算法工程公众号：datayx最近用keras跑基于resnet50，inception3的一些迁移学习的实验，遇...
没有解决我的问题, 去提问

关于验证集准确率和预测结果不同的问题

1条回答 默认 最新

1条回答默认最新