使用随机森林回归预测时，测试集的数据趋势线总是小于1,有办法可以让效果得以改进吗

问题遇到的现象和发生背景

在使用随机森林预测的时候，待评价的有5个指标，其中两个效果好，一个效果一般，两个效果不太好，在检查的过程中发现所有的训练集上
的数据都呈现斜率小于1的趋势，基本上都在0.6左右，我想知道是否有办法可以改善这个问题

问题相关代码，请勿粘贴截图

    df_train = pd.read_excel(r'E:\资料\伽马\标定相关性（更新）.xlsx', sheet_name='Sheet3')

    X = df_train.iloc[:, 3:6].values
    Y = df_train.iloc[:, 2:3].values
    X = X.astype('float32')
    Y = Y.astype('float32')
    
    x_train, x_test, y_train, y_test = train_test_split(X, Y, test_size=0.2, random_state=4825)
    ss_x = StandardScaler()
    x_train = ss_x.fit_transform(x_train)
    x_test = ss_x.fit_transform(x_test)

    rfr = RandomForestRegressor(random_state=1)
    rfr.fit(x_train, y_train.ravel())
    rfr_y_predict = rfr.predict(x_test).reshape(-1, 1)
    rfr_y_train = rfr.predict(x_train).reshape(-1, 1)

    R2_train = r2_score(y_train, rfr_y_train)
    RME_train = np.mean(abs((y_train - rfr_y_train) / y_train))#导师要求的评价指标平均相对误差

    R2_test = r2_score(y_test, rfr_y_predict)
    RME_test = np.mean(abs((y_test - rfr_y_predict) / y_test))#导师要求的评价指标平均相对误差

我想要达到的结果

能够像神经网络得到的结果一样斜率在1左右

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
爱晚乏客游 2022-04-15 09:35
关注
你确定你的数据集和下面的神经网络的是同一个数据集？你这根本就是两个数据集了，同一个数据集再怎么划分离谱也不至于说将整体1的斜率划分成整体0.6的斜率吧

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

R语言回归树/袋装树/随机森林预测 r语言随机森林
2023-02-04 15:22

回答 3 已采纳请参考： # 加载数据 data <- read.csv("data.csv") # 将前 90 个观察值分配给训练集，其余4个观察值分配给评估集 trainIndex <- 1:90
Matlab随机森林预测模型输出权重问题 matlab 有问必答随机森林
2021-12-29 01:07

回答 1 已采纳你好，一般是输出重要性指标，比如你训练X和Y TreeNumber = 50; % 50棵树 minleafNumber = 2; % 2叶 b = TreeBagger(TreeNumber,X,Y
随机森林用于计算变量的重要性算预测还是分类功能呀？ python r语言随机森林
2022-04-22 19:17

回答 1 已采纳一般是用来评估，所以算是预测吧。主要就是信息，熵，决策树。理解了决策树的话，RF也好理解了https://zhuanlan.zhihu.com/p/54286825
数据分析案例-基于PCA主成分分析法对葡萄酒数据进行分析
2023-02-04 09:00

艾派森的博客葡萄酒作为世界上最早的饮料酒之一，其品质和文化早已被人们所认可。据统计2021年，全球葡萄酒产量260亿升，较2020年下降了...本次实验使用葡萄酒数据集进行主成分分析，最后构建葡萄酒分类模型，用来对葡萄酒的分类。
关于lasso回归和随机森林 python 随机森林
2022-04-29 18:44

回答 1 已采纳 lasso筛选后的变量可以用来做随机森林分类但是随机森林之前不需要lasso回归筛选变量，因为树模型可以学习到一些特征交叉，有些变量也许单独看不重要（被剔除掉了）但是和其它特征交叉起来就会变成很强的特
python随机森林分类模型，测试集和训练集的样本数没有准确按照70%和30%分配？ python 机器学习
2019-04-08 11:15

回答 1 已采纳这个不是问题误差的原因可随机抽样有关，在运行几次可能还会有其他的分割结果出现，但都会是在7：3附近
随机森林在训练+验证组（交叉验证）ROC是1 r语言机器学习随机森林
2023-01-13 14:20

回答 1 已采纳 ROC曲线的面积取值范围是0到1，而AUC值为1表示模型完全可以将正样本和负样本区分开来，这个模型性能非常好。在交叉验证中，ROC面积为1可能是由于样本分布导致的，比如说训练集中正样本和负样本分布比例
机器学习入门基础（万字总结）（建议收藏！！！）
2022-12-04 22:36

subsistent的博客介绍机器学习的基础概念和知识，包括机器学习简史、主要流派、与人工智能、数据挖掘的关系、应用领域、算法、一般流程等。伴随着计算机计算能力的不断提升以及大数据时代的迅发展人工智能也取得了前所未有的进步。
使用Python进行随机森林拟合报错：Input contains NaN, infinity or a value too large for dtype('float32'). python 人工智能随机森林
2021-11-01 17:08

回答 2 已采纳如果你确定数据没有空或者未定义，那就是太大了呗
随机森林-matlab matlab 回归随机森林
2022-12-26 14:14

回答 2 已采纳望采纳 随机森林是一种机器学习算法，它的工作原理是建立许多决策树模型，然后将这些模型的预测结果结合起来得出最终的结果。由于随机森林使用了许多决策树模型，因此每个模型的结果可能会有所不同。解决这种情况的
python使用random模块，随机生成一个每个数据元素都小于100且列表长度为20的列表。 python
2022-09-15 11:42

回答 4 已采纳 import random list = [] for i in range(20): num = random.randint(1, 100) if num%2==0:
数据科学导论大作业:数模国赛C题(古代玻璃文物分类)
2022-12-04 17:28

Nucleon_17th的博客数据科学导论大作业:数模国赛C题(古代玻璃文物分类)
随机森林算法如何改进？数据挖掘机器学习
2020-03-27 13:04

回答 1 已采纳 https://www.cnblogs.com/keye/p/10252134.html
SFGAE：一种用于miRNA与疾病关联预测的基于自特征的图自动编码器模型（Briefings in Bioinformatics）
2023-03-17 23:43

嵌入式开发.的博客特别地，SFGAE在基准数据集 HMDD V2.0 和 HMDD V3.2 上改进了最近GAEMDA[1]上的平均AUC，并且在使用较少（例如10%）训练样本时始终表现得更好。此外，SFGAE有效地克服了过平滑问题，并在更深的模型（如八层模型）...
TensorFlow核心知识
2018-03-24 10:18

中华金花茶的博客 TensorFlow概要Google第一代分布式机器学习框架DistBelief１，在内部大规模使用后并没有选择开源。而后第二代分布式机器学习系统TensorFlow２终于选择于2015年11月在GitHub上开源，且在2016年4月补充了分布式...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月14日

悬赏问题

¥15 素材场景中光线烘焙后灯光失效
¥15 请教一下各位，为什么我这个没有实现模拟点击
¥15 执行 virtuoso 命令后，界面没有，cadence 启动不起来
¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
¥20 有关区间dp的问题求解
¥15 多电路系统共用电源的串扰问题
¥15 slam rangenet++配置
¥15 有没有研究水声通信方面的帮我改俩matlab代码
¥15 ubuntu子系统密码忘记
¥15 保护模式-系统加载-段寄存器

使用随机森林回归预测时，测试集的数据趋势线总是小于1,有办法可以让效果得以改进吗

问题遇到的现象和发生背景

问题相关代码，请勿粘贴截图

我想要达到的结果

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新