关于#机器学习#的问题：xgboost 使用reg:linear进行回归预测后，是否可以获得相关的回归方程(语言-python)

xgboost 使用reg:linear进行回归预测后，是否可以获得相关的回归方程。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

CSDN-Ada助手 CSDN-AI 官方账号 2023-07-11 18:59

关注

这篇博客: 【机器学习与算法】python手写算法：xgboost源码复现中的 1、目标函数：linear 部分也许能够解决你的问题, 你可以仔细阅读以下内容或跳转源博客中阅读:

目标函数：1/2 *（y_hat - y） ** 2
一阶导数（grad）：y_hat - y
二阶导数（hess）：1

#INPUT
X = df[[x for x in df.columns if x!='y']]
Y = df['y']
xgb = XGB(n_estimators=2, max_depth=2, reg_lambda=1, min_child_weight=1, objective='linear')
xgb.fit(X,Y)

#OUTPUT：
fitting tree 1...
tree 1 fit done!
fitting tree 2...
tree 2 fit done!
{1: {('V2', 0.166474): {('left', -0.46125265392781317): {('V4', 0.30840057): {('left', -0.4622741764080765): None, ('right', 0.25): None}}, ('right', -0.32500000000000001): {('V3', 0.07025362056365991): {('left', -0.36363636363636365): None, ('right', 0.083333333333333329): None}}}}, 2: {('V2', 0.166474): {('left', -0.41514992294866337): {('V4', 0.30840057): {('left', -0.41609588460960778): None, ('right', 0.23749999999999999): None}}, ('right', -0.29296717171717179): {('V3', 0.07025362056365991): {('left', -0.32793388429752085): None, ('right', 0.076388888888888909): None}}}}}

这里我们指定训练一个两棵树，每棵树深度为2的XGBooster，L2正则项系数指定为1，min_child_weight指定为1，其它用默认参数。
OUTPUT中以json串的形式输出了这两颗树的结构及叶子权重，不太方便看，我们把第一课树重画成树结构，如下图：
在这里插入图片描述
接下来我们来调用一下xgboost包，在同样的数据集上，设定同样的参数，来训练一下，并通过自带的plot_tree函数画出它的第一棵树来对比一下：

from xgboost import XGBClassifier as xx
clf = xx(n_estimators=2, max_depth=2, objective = 'reg:linear',min_child_weight=1, learning_rate=0.1)
clf.fit(X,Y)

from xgboost import plot_tree
import matplotlib.pyplot as plt
import os
os.environ["PATH"] += os.pathsep + 'D:/Program Files/graphviz/bin/'
plot_tree(clf, num_trees=0)
fig = plt.gcf()
fig.set_size_inches(100, 50)
plt.show()

在这里插入图片描述
嗯，一个是分裂点有点有点差异，这是因为我们的程序里直接选取了变量里面的原值作为分裂点；而xgboost包里计算了相邻两个值的中间值，但分出来的样本数量是一样的；二是每个叶子节点的权重都小了10倍，这是因为xgboost画树的时候，把learning_rate也给乘上去了，我们设定的learning_rate就是0.1。
再来对比一下predict的结果：

#python代码结果
#INPUT：
xgb.predict_raw(X).head()
#OUTUT：
0    0.412163
1    0.412163
2    0.412163
3    0.412163
4    0.412163
dtype: float64

#xgboost包结果：
#INPUT:
y_p2 = clf.predict_proba(X)
y_p2[:5]
#OUTPUT：
array([[ 0.58783698,  0.41216299],
       [ 0.58783698,  0.41216299],
       [ 0.58783698,  0.41216299],
       [ 0.58783698,  0.41216299],
       [ 0.58783698,  0.41216299]], dtype=float32)

嗯，也是一样的。

报告相同问题？

关注问题

关于#机器学习#的问题：如图所示的字符串(语言-python) python
2022-10-02 10:29

回答 1 已采纳处理成什么样？能不能说清楚？
关于#机器学习#的问题：问题遇到的现象和发生背景(语言-matlab) matlab 人工智能机器学习
2022-07-30 10:46

回答 1 已采纳注意MATLAB编译和运行Cpp文件需要C++的环境哟~ https://blog.csdn.net/lihe4151021/article/details/121521250这篇文章很好得讲解了如
关于#机器学习#的问题：回归问题中Y值的大小对评估指标的影响是否很大？人工智能机器学习目标检测
2021-07-11 12:02

回答 1 已采纳你的y是指Y(x)=W0+W1*x的Y么？如果是这个的话，y的大小和评估指标是没有影响的，只有y的分布对这个才有影响。如果说rmes，公式如上，如果训练数据（xi,yi）总体上接近一条直线，那么这
python 机器学习回归模型-决策树-多项式-随机森林-KNN-xgboost 遥感影像-回归模型算法
2022-11-20 12:25

吕波涛.的博客 python 机器学习回归模型-决策树-多项式-随机森林-KNN-xgboost 遥感影像-回归模型算法。
关于#机器学习#的问题，如何解决？(语言-python) python 开发语言机器学习
2023-03-12 14:43

回答 2 已采纳这个错误提示表明，在计算距离的时候使用了字符串类型的数据，而距离计算一般是针对数值型数据的。你需要检查你的数据，看看是否有些特征是字符串类型的，如果有，你需要进行相应的处理，将其转换为数值类型，比如使
关于#机器学习#的问题：如何基于交叉验证进行模型的选择与评价人工智能机器学习
2023-02-21 23:52

回答 2 已采纳交叉验证是一种在机器学习中常用的评估模型性能的方法。它的基本思想是将数据集分成若干个互不重叠的子集，然后利用其中的一部分子集作为测试集，而将其他子集作为训练集，这样可以对模型进行多次训练和测试，以获得
关于#机器学习#的问题：RMSE, MAE都是pso_bp最好，而MAPE却是BP最好机器学习神经网络
2022-11-10 21:25

回答 1 已采纳 MAE和RMSE一样，衡量的是真实值与预测值的偏离的绝对大小情况；而MAPE衡量的是偏离的相对大小（即百分率）。相对来说，MAE和MAPE不容易受极端值的影响；而MSE/RMSE采用误差的平方，会放
美赛python学习d8--机器学习二：回归
2022-01-26 23:44

林生时见lu的博客利用训练集拟合回归器，也即是机器“学习”的过程利用拟合好的回归器预测测试集将结果可视化简单线性回归代码 import numpy as np import matplotlib.pyplot as plt import pandas as pd from sklearn.impute ...
关于#python#的问题：用逻辑回归的one VS rest来解决一个三分类的数据 python 分类有问必答机器学习
2022-11-16 14:28

回答 2 已采纳在代码中只需要写一次，因为根据西瓜书第三章的原理，或者sklearn中的解释，内部会训练三个二分类模型从而达到扩展到多分类
关于#机器学习#的问题：标准方程法需要计算X, X^T， (X^TX)^(-1)和y才能计算\theta 有问必答机器学习
2022-06-14 04:19

回答 2 已采纳吴恩达机器学习笔记：Normal equation（正规方程法） - 知乎 Normal equation: Method to solv
关于#python#的知识点：关于求得拟合曲线函数的斜率的问题 python 数据挖掘有问必答机器学习
2021-07-13 15:18

回答 1 已采纳 np.poly1d方法生成的多项式本身带有求导的方法deriv n = np.poly1d([2,3,5,7]) print(n.deriv()) print(n.deriv()(1))
机器学习——初识线性回归(Excel-Python实现)
2023-03-13 18:00

cqjtuwz的博客本文通过Excel，python编写最小二乘法和python引用sklearn三种方法对人的身高和体重进行线性分析。最终得到的结果可以说明身高与体重之间相关性较高。通过三种不同的方法对大量数据进行线性回归分析，使我在过程中对...
关于Python#线性回归#中遇到的syntax error问题，如何解决？ python 机器学习线性回归
2023-01-31 11:42

回答 4 已采纳可以尝试将 w[0] = bias 改为 weight[0] = bias。
机器学习 | 一万六千字！详细解析LinearRegression线性回归经典实验的Python实现
2023-11-12 17:08

小温同学w的博客 机器学习经典实验，详细解析一万六千字
python-机器学习-波士顿房价回归分析
2023-03-25 12:08

姓李与理性不可兼得的博客以波士顿房价数据集为对象，理解数据和认识数据，掌握和的初步方法，掌握的一般方法，对回归分析的结果解读。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月11日

悬赏问题

¥15 求视频摘要youtube和ovp数据集
¥15 怎么改成输入一个要删除的数后现实剩余的数再输入一个删除的数再现实剩余的数用yes表示继续no结束程序
¥15 在启动roslaunch时出现如下问题
¥15 汇编语言实现加减法计算器的功能
¥20 关于多单片机模块化的一些问题
¥30 seata使用出现报错，其他服务找不到seata
¥35 引用csv数据文件（4列1800行），通过高斯-赛德尔法拟合曲线，在选取（每五十点取1点）数据，求该数据点的曲率中心。
¥20 程序只发送0X01,串口助手显示不正确,配置看了没有问题115200-8-1-no，如何解决？
¥15 Google speech command 数据集获取
¥15 vue3+element-plus页面崩溃

关于#机器学习#的问题：xgboost 使用reg:linear进行回归预测后，是否可以获得相关的回归方程(语言-python)

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新