写一个计算gbm模型预测值置信区间的函数


function (random.forest, rf.data, pred.data = rf.data, CI = FALSE, 
    tree.type = "rf", prog.bar = FALSE) 
{
    if (is.null(random.forest$inbag)) {
        stop("Random forest must be trained with keep.inbag = TRUE")
    }
    if (length(unique(colSums(random.forest$inbag))) > 1) {
        stop("The keep.inbag field must store the number of times each observation was used\n           \nMake sure the latest version of the randomForest package is installed from CRAN")
    }
    N.weights <- random.forest$inbag
    B <- ncol(N.weights)
    n <- nrow(N.weights)
    s <- sum(N.weights[, 1])
    N <- Matrix::Matrix(N.weights, sparse = TRUE)
    N.avg <- Matrix::Matrix(Matrix::rowMeans(N), nrow(N), 1)
    if (tree.type == "rf") 
        pred <- predict(random.forest, newdata = pred.data, predict.all = TRUE)$individual
    if (tree.type == "ci") 
        pred <- CB_cforest(rf = random.forest, pb = prog.bar, 
            rf.d = rf.data, p.d = pred.data)$preds
    agg.preds <- rowMeans(pred)
    pred.centered <- pred - agg.preds
    pred.centered.sums <- Matrix::Matrix(rowSums(pred.centered), 
        1, nrow(pred.centered))
    C = N %*% t(pred.centered) - N.avg %*% pred.centered.sums
    raw.IJ <- Matrix::colSums(C^2)/B^2
    N.var <- mean(Matrix::rowMeans(N^2) - Matrix::rowMeans(N)^2)
    boot.var <- rowSums(pred.centered^2)/B
    bias.correction <- n * N.var * boot.var/B
    pred.ij.var <- raw.IJ - bias.correction
    out <- data.frame(pred = agg.preds, pred.ij.var)
    if (CI) {
        out <- data.frame(out, l.ci = out$pred - (out$pred.ij.var * 
            qnorm(0.975, lower.tail = T)), u.ci = out$pred + 
            (out$pred.ij.var * qnorm(0.975, lower.tail = T)))
    }
    return(out)
}
<bytecode: 0x000001e458e749a8>
<environment: namespace:RFinfer>

以上代码是R中用来计算随机森林模型预测值的置信区间的函数，我想要一个按照这种计算方式计算gbm模型的函数，有没有专家帮助改一个的，谢谢了

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
社区专家-Monster-XH 2023-02-22 15:30
关注
基于Monster 组和GPT的调写：
以下是一个按照GBM模型计算预测值置信区间的函数，与上述随机森林模型函数类似，主要是基于构建置信区间所需的样本重复抽样（bootstrap）的思想，其中用到了gbm包的predict.gbm()函数：

library(gbm) gbm_conf_int <- function(gbm.model, data, n.trees = 100, CI = FALSE, alpha = 0.05) { n <- nrow(data) preds <- matrix(0, ncol = n.trees, nrow = n) for (i in 1:n.trees) { preds[, i] <- predict(gbm.model, newdata = data, n.trees = i) } pred.centered <- preds - rowMeans(preds) pred.centered.sums <- rowSums(pred.centered) boot.var <- rowSums(pred.centered^2) / (n.trees - 1) pred_ij_var <- boot.var - (n / n.trees) * var(pred.centered.sums) out <- data.frame(pred = rowMeans(preds), pred_ij_var) if (CI) { z.alpha <- qnorm(1 - alpha / 2) l.ci <- out$pred - z.alpha * sqrt(out$pred_ij_var) u.ci <- out$pred + z.alpha * sqrt(out$pred_ij_var) out <- data.frame(out, l.ci, u.ci) } return(out) }

其中，gbm.model是一个已经拟合好的GBM模型；data是用于预测的数据集，可以与模型拟合时使用的数据集不同；n.trees是用于构建置信区间的决策树数量；CI为逻辑变量，表示是否计算置信区间；alpha为置信水平，取值范围为(0,1)，默认为0.05。

函数主要实现步骤为：

构建预测矩阵，其中行数等于数据集中的观测个数，列数等于n.trees；
计算每个预测值减去所有预测值的平均值；
计算所有列的和，即预测值累加和；
计算每个观测的预测值的方差；
根据置信区间公式计算每个预测值的置信区间。
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

写一个计算gbm模型预测值置信区间的函数 r语言有问必答
2023-02-22 15:11

回答 3 已采纳基于Monster 组和GPT的调写：以下是一个按照GBM模型计算预测值置信区间的函数，与上述随机森林模型函数类似，主要是基于构建置信区间所需的样本重复抽样（bootstrap）的思想，其中用到了gb
gbm模型预测值的置信区间计算 r语言有问必答
2023-02-21 21:28

回答 1 已采纳该回答引用ChatGPT 在R中，可以使用 gbm 包中的 predict 函数来进行预测。要计算每个预测值的置信区间，可以使用 gbm 包中的 predict 函数的 type = "respon
lightgbm调用模型pkl，出现需要先调用拟合？ python 分类机器学习
2022-10-15 14:33

回答 1 已采纳得看你模型保存的方式，如果是通过save_model函数保存的模型，读取方法就得是model_lgb = lgb.Booster(model_file_path)
【机器学习】集成模型/集成学习：多个模型相结合实现更好的预测
2023-10-20 15:23

TwcatL_tree的博客我们通过一个例子来理解集成学习的概念。假设你是一名电影导演，你依据一个非常重要且有趣的话题创作了一部短片。现在，你想在公开发布前获得影片的初步反馈（评级）。有哪些可行的方法呢？A：可以请一位朋友为电影...
采用Catboost模型调用sklearn的permutation_importance计算贡献率时报错，如何解决？(语言-python) python sklearn 机器学习
2022-10-10 22:00

回答 6 已采纳 skelarn的permutation_importance不支持catboost等非sklearn原生模型。
深度学习使用joblib保存模型报错can't pickle weakref objects python 机器学习深度学习
2022-07-02 15:32

回答 1 已采纳你试试看下保存成pkl格式看看，感觉应该是格式的问题
关于预测的滑动窗口数的大小问题人工智能图像处理机器学习
2022-04-26 16:08

回答 6 已采纳窗口大小是10，滑动是1
深度学习：如何有效地利用数据提升模型性能？
2023-08-04 00:57

禅与计算机程序设计艺术的博客深度学习（Deep Learning）一直是机器学习领域中热门的一个研究方向。近年来随着近几年AI的飞速发展，深度学习也在不断刷新科技界的名次。无论是在图像识别、自然语言处理、推荐系统、人脸检测等各个领域，都已经...
Classification metrics can't handle a mix of continuous and multiclass targets python
2022-04-02 21:52

回答 1 已采纳这里感觉是y_test, test_result的类型不一致，之前fit时y_train已转为'int'类型，因此test_result也为'int'类型，而y_test大概不是'int'类型。建议可
python报错'Study' object has no attribute '_study_id' python 机器学习
2022-08-27 16:58

回答 1 已采纳 site-packages里的吗？这一般是你所用到的包可能版本不对。错误的意思是study对象里面没有study_id这个变量你可以去到报错的目录里看一下报错的文件行是否有额外的说明
运行import miceforest as mf时出现 image not found python
2022-03-24 21:45

回答 1 已采纳你是Mac吗，我搜这个问题只有Mac出现，可以参考以下链接的方法尝试一下，重新安装一下lightgbmMac下安装lightgbm-image not found - 冉溪 - 博客园或者按照这个博客
机器学习模型SHAP解释——R语言
2024-04-04 00:21

小庞统计的博客此处，会有歧义，谈谈个人见解，此种解释并非因果关系，与Logistic回归的OR值有区别，此种解释不是因果解释，我们不能因为预测变量shap值贡献大，而认为这个变量是结局变量的危险因素。但是R的SHAP解释，目前应用的...
TypeError: float() argument must be a string or a number, not 'Timestamp'怎么解决呢 python 有问必答
2022-03-28 22:09

回答 3 已采纳你这个就是类型错误呀，参数的类型必须是字符串或数字，而不是时间戳，仔细检查一下代码
模型损失函数变化曲线图_第3章第6节模型融合和提升的算法
2020-11-20 14:10

weixin_39651735的博客 ● bagging和boosting的区别参考回答：Bagging是从训练集中进行子抽样组成每个基模型所需要的子训练集,然后对所有基模型预测的结果进行综合操作产生最终的预测结果。Boosting中基模型按次序进行训练,而基模型的训练...
【视频】R语言逻辑回归（Logistic回归）模型分类预测病人冠心病风险|数据分享...
2023-03-10 14:20

拓端研究室TRL的博客原文链接：http://tecdat.cn/?p=22410本文介绍了逻辑回归并在R语言中用逻辑回归（Logistic...视频：R语言逻辑回归（Logistic回归）模型分类预测病人冠心病风险它只是表示一个只有 2 个输出的变量，例如，预测抛硬...
百面机器学习阅读笔记（一）：模型评估
2022-03-30 11:42

xiyou__的博客降低模型复杂度：神经网络中网络层数、神经元个数正则化方法(正则化如何防止过拟合)： L2正则化（权重衰减），即在代价函数后面再加上一个正则化项，是所有参数的平方和 L1正则化，是所有参数的绝对值和正则化...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 2月22日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 2月22日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 2月22日

悬赏问题

¥15 关于#java#的问题：找一份能快速看完mooc视频的代码
¥15 这种微信登录授权谁可以做啊
¥15 请问我该如何添加自己的数据去运行蚁群算法代码
¥20 用HslCommunication 连接欧姆龙 plc有时会连接失败。报异常为“未知错误”
¥15 网络设备配置与管理这个该怎么弄
¥20 机器学习能否像多层线性模型一样处理嵌套数据
¥20 西门子S7-Graph,S7-300，梯形图
¥50 用易语言http 访问不了网页
¥50 safari浏览器fetch提交数据后数据丢失问题
¥15 matlab不知道怎么改，求解答！！

写一个计算gbm模型预测值置信区间的函数

3条回答 默认 最新

问题事件

悬赏问题

3条回答默认最新