通过统计学分析模型结果的不确定性

如何使用二项检验证明测试集结果的分类准确率是可靠的
我看了西瓜书中检验比较部内容，但是对于使用什么样本来检验以及每个样本的实际误分类概率不知道如何获得

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
David1055259499 2023-07-03 23:06
关注
来自GPT的回答：

在机器学习中，可以使用统计学分析来评估模型结果的不确定性和可靠性。一种常用的方法是使用二项检验来验证测试集结果的分类准确率。

二项检验是一种用于比较两个比例（或概率）的统计检验方法。在这种情况下，我们可以将测试集的分类准确率视为一个比例，例如正确分类的样本数与总样本数之比。

以下是一个使用二项检验来验证分类准确率的示例步骤：

假设检验：

零假设（H0）：测试集分类准确率是可靠的，即模型的准确率等于或超过一个特定的阈值。
对立假设（H1）：测试集分类准确率不可靠，即模型的准确率低于阈值。
选择显著性水平：

显著性水平（或显著性水平）是决定是否拒绝零假设的阈值。通常选择的显著性水平是0.05或0.01。
计算分类准确率：

对测试集进行预测并计算分类准确率。将准确率表示为一个比例，例如正确分类的样本数与总样本数之比。
确定拒绝域：

根据显著性水平和零假设，计算拒绝域的临界值。这个临界值将决定是否拒绝零假设。
进行二项检验：

将测试集的分类准确率与拒绝域进行比较。如果分类准确率落在拒绝域内，则拒绝零假设，即测试集分类准确率不可靠。
要获得每个样本的实际误分类概率，你需要有样本的真实标签（或类别）信息。然后，你可以将样本与模型的预测进行比较，计算出实际的误分类情况。通过统计这些误分类情况，你可以获得样本的实际误分类概率。

请注意，二项检验只是评估测试集分类准确率的一种方法。在实际应用中，还可以考虑使用交叉验证、置信区间或其他评估指标来评估模型的不确定性和可靠性。

希望这些信息对你有帮助！如果有更多问题，请随时提问。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

应届生求职数据分析，产品运营等岗位需要的技术栈分别要掌握到哪些程度啊sql，python，统计学知识，tableau2，运用到的模型和思维要怎么学习会比较好啊产品运营数据分析
2022-10-22 13:22

回答 3 已采纳运营不懂，就不说了，说下数据分析需要掌握的吧数据库：增删改查这个就不说了，至少要熟练，很多数据库维护到到最后天天就这几个操作了。另外就是索引和查询，查询怎么加快速度等，另外就是内连接外连接，事务管理等
统计学：如何比较两种疾病风险分级方法的一致性和优劣 r语言学习方法有问必答
2023-01-31 21:57

回答 2 已采纳回答不易，求求您采纳点赞哦可以使用以下统计方法来比较两种疾病风险分级方法的一致性和优劣：克莱姆相关系数：可以评估两种方法分级结果的相关性，但对于低相关性也不能很好的说明两种方法的一致性 Kap
李航《统计学习》中有概念弄不明白人工智能支持向量机机器学习
2021-07-09 15:46

回答 1 已采纳 1、点表示任意变量；2、沿着约束方向未经剪辑是未考虑不等式约束时
熵与机器学习：如何度量不确定性
2023-12-31 01:53

禅与计算机程序设计艺术的博客熵是来自于信息论的一个概念，它是由诺亚·海姆尔（Claude Shannon）在1948年的一篇论文中引入的...信息论提供了一种新的观点来研究信息和不确定性之间的关系，这种观点对于机器学习和人工智能的发展产生了深远的影响。
统计学习方法三要素中模型和算法的区别算法
2018-02-24 13:24

回答 4 已采纳个人理解（还请多多指教）：模型相当于特定的分类器集合；策略相当于评价函数，用于判断分类器的优劣；而算法相当于一个用于在假设空间中找到评价函数得分最高的分类器的搜索算法。举例说明，模型如支持向量
python求众数且结果按从小到大顺序排列 python 开发语言
2023-03-26 15:25

回答 1 已采纳 python求众数，代码如下，望采纳！！！ def find_mode(x): count_total = {} max_count = 1 # 统计每个数字出现的次数
工科生学了许多数据分析方法有用吗学习方法
2022-09-27 22:25

回答 2 已采纳回答这个问题前，引用一段古话：吾生也有涯，而知也无涯。以有涯随无涯，殆已！已而为知者，殆而已矣！为善无近名，为恶无近刑，缘督以为经，可以保身，可以全生，可以养亲，可以尽年。没有实际用处的知识，犹
不确定性数学.pdf
2023-05-25 20:25

不确定性数学有很多应用领域，例如人工智能、机器学习、自然语言处理、图像识别、 Expert System 等。它可以用来解决许多实际问题，例如预测、决策、风险评估、优化等。在不确定性数学中，我们还研究了许多重要的...
怎样把不嵌套mysql语言改成嵌套的 mysql 数据库有问必答
2022-10-20 15:57

回答 2 已采纳 SELECT S.sn,MAX(g) FROM S,C 还是用了关联查询，而且没加上on
请问真随机数是保证不重复还是不保证不重复 c语言 java
2019-11-10 14:34

回答 3 已采纳如果数字是无限的，按照随机数的定义肯定是不重复的了。但现实生活中，哪有无限的数字，所以现实中随机数是可重复的。
利用jdbc连接数据库access后，编写sql语句运行，为啥access表里不更新啊？ java 数据库
2022-11-19 14:24

回答 1 已采纳你可以参考下这篇文章：[新人向]Access的安装以及关于JDBC-ODBC桥连接Access数据库的方法、问题和解决
深入解读Meta分析：原理、公式、操作步骤及结果分析；R语言Meta回归分析、诊断分析、不确定性分析与精美作图
2024-05-29 12:43

小艳加油的博客本教程针对Meta分析原理、公式、操作步骤及结果分析，进阶应用进行详细解析，结合多个例子，熟练掌握Meta分析全流程和不确定性分析，并结合机器学习等方法讲解Meta分析在文献大数据的延伸应用。
中位数是统计学中的一求中位数:如果有2n+1个数，其中第n+1大的那个数就是中位数。如果有2n个数，第n大和第n+1大的那两个数的平均值就是中位数。给定n（n≤1000）个正整数，求它们的中位数。 c语言
2023-04-11 15:46

回答 1 已采纳该回答通过自己思路及引用到GPTᴼᴾᴱᴺᴬᴵ搜索,得到内容具体如下：以下是一个用 C 语言实现的解题思路：读入正整数个数 n 和 n 个正整数，存储到数组中。对数组进行排序，可以使用快速排序或者其他
统计学基础概念和在AI中的应用
2024-03-20 07:00

DevDiary的博客 统计学是一门研究数据收集、分析、解释和展示的科学，它提供了一套方法论，用于理解数据并从数据中得出结论。统计学在各个领域都有应用，包括经济学、医学、工程学、社会科学等。
AI人工智能学习之回归分析
2022-10-21 17:43

逸剑听潮的博客回归分析，回归方程，一元线性回归，多元线性回归，线性回归，逻辑回归，套索回归
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 7月18日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 7月10日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月3日

悬赏问题

¥15 在centos7安装conda
¥15 c#调用yolo3 dll文件获取的数据对不上
¥20 WPF 如何实现多语言，label 和cs(live Charts)中是否都能翻译
¥15 STM32F103上电短路问题
¥15 关于#单片机#的问题：以ATMEGA128或相近型号单片机为控制器设计直流电机调速的闭环控制系统（相关搜索：设计报告|软件设计|流程图）
¥15 打开软件提示错误：failed to get wglChoosePixelFormatARB
¥15 (标签-python|关键词-char)
¥15 python+selenium，在新增时弹出了一个输入框
¥15 苹果验机结果的api接口哪里有？？单次调用1毛钱及以下。
¥20 学生成绩管理系统设计

通过统计学分析模型结果的不确定性

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新