求问大家,这是普遍认同的k折交叉验证定义:
将原始数据D随机分成K份,每次选择(K-1)份作为训练集,剩余的1份作为测试集。交叉验证重复K次,取K次准确率的平均值作为最终模型的评价指标。它可以有效避免过拟合和欠拟合状态的发生,K值的选择根据实际情况调节。
真实实验过程中,我将k设为5,并不断把五次结果append进列表。但是为什么一定要选取这几次结果准确率的平均值呢?我想输出准确率最高的那次结果,这样准确率相应也成为最高的,这是可取的吗?
求解答!
k折交叉验证选取准确率最高的结果可以吗
- 写回答
- 好问题 0 提建议
- 追加酬金
- 关注问题
- 邀请回答
-
1条回答 默认 最新
- 我写bug贼6 2021-11-16 15:52关注
如你所说,它最终是一个模型的评价指标,用于评价模型的能力。
用k折交叉,是为了尽可能消除因为数据的划分带来的波动,选取平均结果很大程度上减小了因为某次数据划分失衡带来的误差;取极值其实是放大了这个误差。
用平均数选取的最优模型大概率是一个发挥稳定的选手,取极值选取的模型大概率是一个神经刀。
所以,一般情况是不可取的,除非你的使用场景就需要一个神经刀。
本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 1无用
悬赏问题
- ¥15 uniapp uview http 如何实现统一的请求异常信息提示?
- ¥15 目详情-五一模拟赛详情页
- ¥15 有了解d3和topogram.js库的吗?有偿请教
- ¥100 任意维数的K均值聚类
- ¥15 stamps做sbas-insar,时序沉降图怎么画
- ¥15 买了个传感器,根据商家发的代码和步骤使用但是代码报错了不会改,有没有人可以看看
- ¥15 关于#Java#的问题,如何解决?
- ¥15 加热介质是液体,换热器壳侧导热系数和总的导热系数怎么算
- ¥100 嵌入式系统基于PIC16F882和热敏电阻的数字温度计
- ¥15 cmd cl 0x000007b