biubiu989898 2021-11-16 15:33 采纳率: 80%
浏览 148
已结题

k折交叉验证选取准确率最高的结果可以吗

求问大家,这是普遍认同的k折交叉验证定义:
将原始数据D随机分成K份,每次选择(K-1)份作为训练集,剩余的1份作为测试集。交叉验证重复K次,取K次准确率的平均值作为最终模型的评价指标。它可以有效避免过拟合和欠拟合状态的发生,K值的选择根据实际情况调节。
真实实验过程中,我将k设为5,并不断把五次结果append进列表。但是为什么一定要选取这几次结果准确率的平均值呢?我想输出准确率最高的那次结果,这样准确率相应也成为最高的,这是可取的吗?
求解答!

  • 写回答

1条回答 默认 最新

  • 我写bug贼6 2021-11-16 15:52
    关注

    如你所说,它最终是一个模型的评价指标,用于评价模型的能力。

    用k折交叉,是为了尽可能消除因为数据的划分带来的波动,选取平均结果很大程度上减小了因为某次数据划分失衡带来的误差;取极值其实是放大了这个误差。

    用平均数选取的最优模型大概率是一个发挥稳定的选手,取极值选取的模型大概率是一个神经刀。

    所以,一般情况是不可取的,除非你的使用场景就需要一个神经刀。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 11月24日
  • 已采纳回答 11月16日
  • 创建了问题 11月16日

悬赏问题

  • ¥15 uniapp uview http 如何实现统一的请求异常信息提示?
  • ¥15 目详情-五一模拟赛详情页
  • ¥15 有了解d3和topogram.js库的吗?有偿请教
  • ¥100 任意维数的K均值聚类
  • ¥15 stamps做sbas-insar,时序沉降图怎么画
  • ¥15 买了个传感器,根据商家发的代码和步骤使用但是代码报错了不会改,有没有人可以看看
  • ¥15 关于#Java#的问题,如何解决?
  • ¥15 加热介质是液体,换热器壳侧导热系数和总的导热系数怎么算
  • ¥100 嵌入式系统基于PIC16F882和热敏电阻的数字温度计
  • ¥15 cmd cl 0x000007b