Incredible_l 2021-12-17 09:27 采纳率: 0%
浏览 210
已结题

为什么我的机器学习模型在训练集上的R^2接近1,而在交叉验证集上的R^2只有0.6左右,而在测试集上的R^2也接近1

问题遇到的现象和发生背景

利用ExtraTreesRegressor进行回归,发现训练集上的R^2接近1,而在交叉验证集上的R^2只有0.6左右,而在测试集上的R^2也接近1

问题相关代码,请勿粘贴截图
def model(X,y,regression,**kwargs):
    t0 = time.time()
    kf = KFold(5,shuffle = True,random_state = 1)
    X_train,X_test,y_train,y_test = train_test_split(X,y,test_size = 0.3,random_state = 1)
    reg = regression(**kwargs)
    reg.fit(X,y)
    r2 = cross_val_score(reg,X_train,y_train,scoring = 'r2',cv = kf).mean()
    pred = reg.predict(X_test)
    r2_t = r2_score(y_test,pred)
    t1 = '%.3f s' %(time.time() - t0)
    return r2,t1,r2_t
运行结果及报错内容

model(X,y,ETR)
(0.6136022030545359, '142.728 s', 0.9833922526081965)

我的解答思路和尝试过的方法
我想要达到的结果

如果训练集和交叉验证集上的R^2差距过大,那么模型在测试集上表现应该也不佳?

  • 写回答

1条回答 默认 最新

  • 有问必答小助手 2021-12-20 11:30
    关注

    你好,我是有问必答小助手,非常抱歉,本次您提出的有问必答问题,技术专家团超时未为您做出解答


    本次提问扣除的有问必答次数,将会以问答VIP体验卡(1次有问必答机会、商城购买实体图书享受95折优惠)的形式为您补发到账户。


    因为有问必答VIP体验卡有效期仅有1天,您在需要使用的时候【私信】联系我,我会为您补发。

    评论

报告相同问题?

问题事件

  • 系统已结题 12月25日
  • 创建了问题 12月17日

悬赏问题

  • ¥15 如何在scanpy上做差异基因和通路富集?
  • ¥20 关于#硬件工程#的问题,请各位专家解答!
  • ¥15 关于#matlab#的问题:期望的系统闭环传递函数为G(s)=wn^2/s^2+2¢wn+wn^2阻尼系数¢=0.707,使系统具有较小的超调量
  • ¥15 FLUENT如何实现在堆积颗粒的上表面加载高斯热源
  • ¥30 截图中的mathematics程序转换成matlab
  • ¥15 动力学代码报错,维度不匹配
  • ¥15 Power query添加列问题
  • ¥50 Kubernetes&Fission&Eleasticsearch
  • ¥15 報錯:Person is not mapped,如何解決?
  • ¥15 c++头文件不能识别CDialog