cess�
2019-04-08 11:15
采纳率: 100%
浏览 5.4k

python随机森林分类模型,测试集和训练集的样本数没有准确按照70%和30%分配?

总样本是1440,按照70%和30%划分训练和测试集,训练集和测试集的样本数应该是1008和432。但是在随机森林分类的混淆矩阵中,它们的样本数为1007和433。请问为什么会有误差?这属于正常情况吗?

  • 写回答
  • 好问题 提建议
  • 关注问题
  • 收藏
  • 邀请回答

1条回答 默认 最新

  • 吃鸡王者 2019-04-09 09:47
    已采纳

    这个不是问题
    误差的原因可随机抽样有关,在运行几次可能还会有其他的分割结果出现,但都会是在7:3附近

    已采纳该答案
    评论
    解决 无用
    打赏 举报