weixin_62936205 2022-12-28 10:09 采纳率: 100%

已结题

r语言分类器性能指标

rm(list = ls())
library(dplyr）

新建两列，分别是sepal的长款比（sepal_ratio)和

petal的长宽比(petal_ratio)

df <-read.csv("/data/bigfiles/iris.csv")

我们可以发现Iris-setosa的sepal_ratio值最小，所以可以通过设置一个

sepal_ratio的阈值来把Iris-setosa辨识出来

也就是说，我们此时有一个极简分类器（决策树桩）

只要sepal_ratio小于这个阈值，就将样本预测为Iris-setosa

设置阈值为1.9

thres <- 1.9

使用filter，nrow函数，求整个样本集中的Iris-setosa的个数

n_setosa_all <- df %>%

根据这个阈值thres正确识别出来的Iris-setosa的个数

正确识别的意思就是，它真的是Iris-setosa，并且模型也认为它是Iris-setosa

所谓的模型就是sepal_ratio小于thres即预测为Iris-setosa

n_setosa_hit <-
df %>%

求True positive rate (TPR)

TPR就是检测出来的真阳性(这里的阳就是Iris-setosa）样本数除以

所有真实阳性样本数

tpr <-

求我们根据这个阈值thres错误识别为Iris-setosa的个数(假阳性个数)

n_false_alarm <- df %>%

求False positive rate (FPR)

FPR的含义是检测出来的假阳性样本数除以所有真实阴性样本数。

fpr <-
print(paste(round(tpr, 2), round(fpr, 2)))

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

ShowMeAI 2022-12-28 10:24

关注

完整的代码如下，望采纳

# 清空环境中的对象列表
rm(list = ls())

# 加载 dplyr 包
library(dplyr)

# 读取 iris 数据集
df <- read.csv("/data/bigfiles/iris.csv")

# 计算花萼和花瓣的长宽比
df <- df %>%
  # 在数据集中添加两列：花萼长宽比和花瓣长宽比
  mutate(sepal_ratio = Sepal.Length / Sepal.Width,
         petal_ratio = Petal.Length / Petal.Width)

# 设置花萼长宽比的阈值
thres <- 1.9

# 计算数据集中 Iris-setosa 的个数
n_setosa_all <- df %>%
  # 筛选出种类为 Iris-setosa 的样本
  filter(Species == "Iris-setosa") %>%
  # 计算样本数
  nrow

# 计算正确识别的 Iris-setosa 的个数
n_setosa_hit <- df %>%
  # 筛选出种类为 Iris-setosa 且花萼长宽比小于阈值的样本
  filter(Species == "Iris-setosa", sepal_ratio < thres) %>%
  # 计算样本数
  nrow

# 计算真阳性率
tpr <- n_setosa_hit / n_setosa_all

# 计算假阳性的个数
n_false_alarm <- df %>%
  # 筛选出种类不是 Iris-setosa 且花萼长宽比小于阈值的样本
  filter(Species != "Iris-setosa", sepal_ratio < thres) %>%
  # 计算样本数
  nrow

# 计算假阳性率
fpr <- n_false_alarm / (nrow(df) - n_setosa_all)

# 输出结果
print(paste(round(tpr, 2), round(fpr, 2)))

本回答被题主选为最佳回答 , 对您是否有帮助呢?

报告相同问题？

关注问题

r语言分类器性能指标 r语言
2022-12-28 10:09

回答 1 已采纳完整的代码如下，望采纳 # 清空环境中的对象列表 rm(list = ls()) # 加载 dplyr 包 library(dplyr) # 读取 iris 数据集 df <- read.c
R语言把数据转化成矩阵后，分类变量名称后多了个1 r语言
2023-02-07 21:27

回答 3 已采纳如果分类变量名称后多了一个1，那么你需要修改分类变量名称来解决这个问题。在R中，可以使用以下代码来修改列名： colnames(data)[colnames(data) == "gender1"]
kmeans聚类；R语言 r语言聚类
2023-03-06 15:27

回答 10 已采纳 K-means聚类R语言代码： # 读取数据 data <- read.csv("C:/Users/lenovo/Desktop/data.csv", header=TRUE, strings
编程语言分类
2023-03-06 20:23

橙子味冰可乐的博客 编程语言分类
R语言使用psych包里的mediate做中介分析报错，请问是哪里的问题 r语言
2023-04-12 22:24

回答 4 已采纳基于Monster 组和GPT的调写：在 psych 包中的 mediate 函数的参数列表中，没有 treat, mediator, robustSE, sims 和 boot 参数。因此，用 m
高斯混合模型分类结果 r语言分类
2022-12-28 20:21

回答 1 已采纳望采纳！点击该回答右侧的“采纳”按钮即可采纳！！我之前是使用 mclust 包中的 predict() 函数对数据进行预测，该函数会返回每个数据点属于哪一类的类别标签。代码如下先安装并导入 mcl
Bert二分类结果分析 bert 分类自然语言处理
2023-03-27 22:47

回答 3 已采纳该回答引用自ChatGPT 有几个可能的原因可以导致risk类别的预测f1-score始终为0：数据不平衡问题：尽管您使用了Focal Loss来改善数据不平衡问题，但如果risk类别的训练数据量非
【程序语言】-- 编程语言分类和应用
2022-10-04 13:18

若竹之心的博客 Java，服务器端最好的编程语言 C++，最通用的编程语言 C，迄今为止，最值得信任的编程语言 Python，Ai人工智能，机器学习方向最佳的编程语言 JavaScript，客户端最常用的脚本语言 C#，微软最强有力的面向对象的编程...
C#调用阿里云NLP智能语言处理的SDK示例时报错如何处理？ c# 有问必答自然语言处理阿里云
2022-01-12 15:47

回答 1 已采纳 Endpoint更换上海的试试 config.Endpoint = "nlp.cn-shanghai.aliyuncs.com"; 我这测试更换上海不提示不知道这样的主机错误，由于没购买服务，也
多标签文本分类模型训练后在验证集上F1值为0 pytorch 分类自然语言处理
2023-04-16 13:55

回答 2 已采纳你好，根据你提供的信息，可能有以下几个原因：数据集问题：可能训练集和验证集的数据分布不一致，导致模型在验证集上表现不佳。建议检查一下数据集是否存在标签分布不均衡的情况。模型问题：可能预训练模型Ro
Python在input打出"我"，就能出现"你，他，你们，我们，他们，他们的，七大姑八大姨"，涉及自然语言词汇的整理，怎么做？ python 分类语言模型
2022-08-06 02:43

回答 3 已采纳这个可以考虑下载一个腾讯800万中文词向量，开源的，网上就有，下载完成后。用annoy建立索引库，annoy里支持的是最大近似近邻算法，由于腾讯的词向量本身是大量语料训练出来的，相近词的词向量距离近，
编程语言发展历史
2023-09-15 16:30

silence_laobai的博客 编程语言发展历史
如何批量地将数据集中的分类变量设置成因子变量 r语言
2019-04-02 10:30

回答 3 已采纳 for (i in colnames(data)){ data[,i]<-as.factor(data[,i]) }
编程语言发展史之：编程语言的未来趋势
2023-09-25 01:00

禅与计算机程序设计艺术的博客 编程语言”这个概念在近几年间已经成为现代科技领域的一个热门话题。它从诞生到今天已经经历了几百年的历史，各个编程语言都各不相同，但其中的共同点无疑就是可以实现一些程序功能。而“未来趋势”，则指的是这一...
不同类编程语言的特点
2021-03-28 16:43

恰好路过人间的博客 C语言基本性 1、高级语言：它是把高级语言的基本结构和语句与低级语言的实用性结合起来的...4、代码级别的跨平台：由于标准的存在，使得几乎同样的C代码可用于多种操作系统，如Windows、DOS、UNIX等等；也适用于多种机
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 1月5日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 12月28日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 12月28日

悬赏问题

¥100 set_link_state
¥15 虚幻5 UE美术毛发渲染
¥15 CVRP 图论物流运输优化
¥15 Tableau online 嵌入ppt失败
¥100 支付宝网页转账系统不识别账号
¥15 基于单片机的靶位控制系统
¥15 真我手机蓝牙传输进度消息被关闭了，怎么打开？(关键词-消息通知)
¥15 装 pytorch 的时候出了好多问题，遇到这种情况怎么处理？
¥20 IOS游览器某宝手机网页版自动立即购买JavaScript脚本
¥15 手机接入宽带网线，如何释放宽带全部速度