就是我现在做出行时段预测,一天24小时,每隔3小时分为8组,这些是分类标签。然后数据X的话,有出行方式,性别,年龄等等。例如出行方式里面又分为6组,火车,高铁等等。最后我的模型,对测试集精度很低。然后我先剪枝,但减去几列后,依然很低,精度只有0.2左右。我现在开始觉得是不是我每列分类太多的原因,但又觉得决策树算法应该有能力处理比较复杂的分类问题,很困扰。