weixin_53628166 2023-07-06 14:33 采纳率: 66.7%
浏览 23
已结题

为啥用模型预测时,把数据集放在在一个表格通过train_test_split划分预测的测试集效果特别好,而把训练集跟测试集分为两个表格预测测试集效果很差

为啥我用随机森林模型预测时,把数据集放在在一个表格通过train_test_split划分预测的测试集效果特别好,而把训练集跟测试集分为两个表格预测测试集效果很差

  • 写回答

2条回答 默认 最新

  • 喝茶品人生 2023-07-06 14:48
    关注

    这是必然的,你分两个表会有数据分布上的差异,模型在训练的时候当然没办法准确学习测试集信息

    本回答被专家选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 7月17日
  • 专家已采纳回答 7月9日
  • 创建了问题 7月6日

悬赏问题

  • ¥15 CCF-CSP 2023 第三题 解压缩(50%)
  • ¥30 comfyui openpose报错
  • ¥20 Wpf Datarid单元格闪烁效果的实现
  • ¥15 图像分割、图像边缘提取
  • ¥15 sqlserver执行存储过程报错
  • ¥100 nuxt、uniapp、ruoyi-vue 相关发布问题
  • ¥15 浮窗和全屏应用同时存在,全屏应用输入法无法弹出
  • ¥100 matlab2009 32位一直初始化
  • ¥15 Expected type 'str | PathLike[str]…… bytes' instead
  • ¥15 三极管电路求解,已知电阻电压和三级关放大倍数