这个bug有点多 2022-05-20 21:20 采纳率: 0%
浏览 81
已结题

决策树怎么处理分类标签比较多的数据?

就是我现在做出行时段预测,一天24小时,每隔3小时分为8组,这些是分类标签。然后数据X的话,有出行方式,性别,年龄等等。例如出行方式里面又分为6组,火车,高铁等等。最后我的模型,对测试集精度很低。然后我先剪枝,但减去几列后,依然很低,精度只有0.2左右。我现在开始觉得是不是我每列分类太多的原因,但又觉得决策树算法应该有能力处理比较复杂的分类问题,很困扰。

  • 写回答

4条回答 默认 最新

  • 鸡蛋酱$ 2022-05-20 21:46
    关注
    获得2.50元问题酬金

    你的出行方式有六种,属于特征,你试一试把你的出行方式弄成ont-hot编码来试一试,这样就不存在每列分类太多的问题啦

    评论

报告相同问题?

问题事件

  • 系统已结题 5月28日
  • 创建了问题 5月20日