如何使用二项检验证明测试集结果的分类准确率是可靠的
我看了西瓜书中检验比较部内容,但是对于使用什么样本来检验以及每个样本的实际误分类概率不知道如何获得
![](https://profile-avatar.csdnimg.cn/6c577ef66f094371bb8ba8de510c03b4_weixin_44918105.jpg!4)
通过统计学分析模型结果的不确定性
- 写回答
- 好问题 0 提建议
- 追加酬金
- 关注问题
- 邀请回答
-
2条回答 默认 最新
- David1055259499 2023-07-03 23:06关注
来自GPT的回答:
在机器学习中,可以使用统计学分析来评估模型结果的不确定性和可靠性。一种常用的方法是使用二项检验来验证测试集结果的分类准确率。
二项检验是一种用于比较两个比例(或概率)的统计检验方法。在这种情况下,我们可以将测试集的分类准确率视为一个比例,例如正确分类的样本数与总样本数之比。
以下是一个使用二项检验来验证分类准确率的示例步骤:
假设检验:
零假设(H0):测试集分类准确率是可靠的,即模型的准确率等于或超过一个特定的阈值。
对立假设(H1):测试集分类准确率不可靠,即模型的准确率低于阈值。
选择显著性水平:显著性水平(或显著性水平)是决定是否拒绝零假设的阈值。通常选择的显著性水平是0.05或0.01。
计算分类准确率:对测试集进行预测并计算分类准确率。将准确率表示为一个比例,例如正确分类的样本数与总样本数之比。
确定拒绝域:根据显著性水平和零假设,计算拒绝域的临界值。这个临界值将决定是否拒绝零假设。
进行二项检验:将测试集的分类准确率与拒绝域进行比较。如果分类准确率落在拒绝域内,则拒绝零假设,即测试集分类准确率不可靠。
要获得每个样本的实际误分类概率,你需要有样本的真实标签(或类别)信息。然后,你可以将样本与模型的预测进行比较,计算出实际的误分类情况。通过统计这些误分类情况,你可以获得样本的实际误分类概率。请注意,二项检验只是评估测试集分类准确率的一种方法。在实际应用中,还可以考虑使用交叉验证、置信区间或其他评估指标来评估模型的不确定性和可靠性。
希望这些信息对你有帮助!如果有更多问题,请随时提问。
本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 无用评论 打赏 举报
悬赏问题
- ¥15 在centos7安装conda
- ¥15 c#调用yolo3 dll文件获取的数据对不上
- ¥20 WPF 如何实现多语言,label 和cs(live Charts)中是否都能翻译
- ¥15 STM32F103上电短路问题
- ¥15 关于#单片机#的问题:以ATMEGA128或相近型号单片机为控制器设计直流电机调速的闭环控制系统(相关搜索:设计报告|软件设计|流程图)
- ¥15 打开软件提示错误:failed to get wglChoosePixelFormatARB
- ¥15 (标签-python|关键词-char)
- ¥15 python+selenium,在新增时弹出了一个输入框
- ¥15 苹果验机结果的api接口哪里有??单次调用1毛钱及以下。
- ¥20 学生成绩管理系统设计