网上也有一些这种问题,但好像跟我的情况不太一样,因为我基本排除了大家普遍认为的数据分布问题。
请看介绍:
我做的实验,官方只有训练集和测试集,数据类别都有三类,其中两个占比较小的类别的分布有些差异。
我用训练集的10%作为验证集,用来调参,测试集用来评估。
我的处理:
为了避免分布不均匀问题,我切分验证集时进行了两种切分方式,一种是随机切分,一种是验证集和训练集保持同分布,两种方式都能得到很理想的结果,准确率基本稳定在同一个百分点。
但测试集准确率却表现特别不好,跟验证集能差10个百分点左右。
排除数据处理方式
经再三确认,所有数据集的数据处理方式完全相同。
请问这种情况有什么可能的原因吗?重金悬赏,感谢!
模型在验证集上表现很好,但测试集的准确率却有点低,都有什么可能的原因呢?
- 写回答
- 好问题 0 提建议
- 追加酬金
- 关注问题
- 邀请回答
-
7条回答
相关推荐 更多相似问题
点击登录
提问题
悬赏问题
- ¥30 pyinstaller后不执行print且不能退出
- ¥15 IncredBuild报错
- ¥15 锂电池偏最小二乘法参数辩识
- ¥15 session失效问题
- ¥15 GMS地下水数值模拟无法打开
- ¥15 树型结构的数据怎么匹配分支
- ¥15 stm32F4用.引不出来结构体成员怎么解决
- ¥30 Syntax Error: TypeError: this.getOptions is not a function的问题
- ¥15 eclipse Android环境搭建
- ¥15 unity中脚本之间的继承有什么作用