cess�
2019-04-08 11:15
采纳率: 100%
浏览 5.4k

python随机森林分类模型,测试集和训练集的样本数没有准确按照70%和30%分配?

总样本是1440,按照70%和30%划分训练和测试集,训练集和测试集的样本数应该是1008和432。但是在随机森林分类的混淆矩阵中,它们的样本数为1007和433。请问为什么会有误差?这属于正常情况吗?

 • 写回答
 • 好问题 提建议
 • 关注问题
 • 收藏
 • 邀请回答

1条回答 默认 最新

 • 吃鸡王者 2019-04-09 09:47
  已采纳

  这个不是问题
  误差的原因可随机抽样有关,在运行几次可能还会有其他的分割结果出现,但都会是在7:3附近

  已采纳该答案
  评论
  解决 无用
  打赏 举报