biubiu989898 2021-11-16 15:33 采纳率: 80%
浏览 148
已结题

k折交叉验证选取准确率最高的结果可以吗

求问大家,这是普遍认同的k折交叉验证定义:
将原始数据D随机分成K份,每次选择(K-1)份作为训练集,剩余的1份作为测试集。交叉验证重复K次,取K次准确率的平均值作为最终模型的评价指标。它可以有效避免过拟合和欠拟合状态的发生,K值的选择根据实际情况调节。
真实实验过程中,我将k设为5,并不断把五次结果append进列表。但是为什么一定要选取这几次结果准确率的平均值呢?我想输出准确率最高的那次结果,这样准确率相应也成为最高的,这是可取的吗?
求解答!

  • 写回答

1条回答 默认 最新

  • 我写bug贼6 2021-11-16 15:52
    关注

    如你所说,它最终是一个模型的评价指标,用于评价模型的能力。

    用k折交叉,是为了尽可能消除因为数据的划分带来的波动,选取平均结果很大程度上减小了因为某次数据划分失衡带来的误差;取极值其实是放大了这个误差。

    用平均数选取的最优模型大概率是一个发挥稳定的选手,取极值选取的模型大概率是一个神经刀。

    所以,一般情况是不可取的,除非你的使用场景就需要一个神经刀。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 11月24日
  • 已采纳回答 11月16日
  • 创建了问题 11月16日

悬赏问题

  • ¥15 基于卷积神经网络的声纹识别
  • ¥15 Python中的request,如何使用ssr节点,通过代理requests网页。本人在泰国,需要用大陆ip才能玩网页游戏,合法合规。
  • ¥100 为什么这个恒流源电路不能恒流?
  • ¥15 有偿求跨组件数据流路径图
  • ¥15 写一个方法checkPerson,入参实体类Person,出参布尔值
  • ¥15 我想咨询一下路面纹理三维点云数据处理的一些问题,上传的坐标文件里是怎么对无序点进行编号的,以及xy坐标在处理的时候是进行整体模型分片处理的吗
  • ¥15 CSAPPattacklab
  • ¥15 一直显示正在等待HID—ISP
  • ¥15 Python turtle 画图
  • ¥15 stm32开发clion时遇到的编译问题