决策树怎么处理分类标签比较多的数据?

就是我现在做出行时段预测，一天24小时，每隔3小时分为8组，这些是分类标签。然后数据X的话，有出行方式，性别，年龄等等。例如出行方式里面又分为6组，火车，高铁等等。最后我的模型，对测试集精度很低。然后我先剪枝，但减去几列后，依然很低，精度只有0.2左右。我现在开始觉得是不是我每列分类太多的原因，但又觉得决策树算法应该有能力处理比较复杂的分类问题，很困扰。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
鸡蛋酱$ 2022-05-20 21:46
关注
获得2.50元问题酬金

你的出行方式有六种，属于特征，你试一试把你的出行方式弄成ont-hot编码来试一试，这样就不存在每列分类太多的问题啦

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

基于机器学习的决策树 - 鸢尾花分类 Python 源码
2025-02-20 10:55

本文通过一个典型的多类分类问题——鸢尾花分类，介绍了如何利用决策树模型在Python环境下进行数据集的分类处理。首先，我们来了解一下鸢尾花数据集。鸢尾花数据集是机器学习领域的一个经典数据集，由英国统计学家...
python:基于ID3算法的决策树应用男女分类
2022-04-26 20:23

运用python对ID3算法原理进行编写，然后应用再男女分类上，形成树。读者可以直接使用，可根据自己的需求修改训练集和测试集
python实现决策树分类（2）
2021-01-21 17:29

在上一篇文章中，我们已经构建了决策树，接下来可以使用它用于实际的数据分类。在执行数据分类时，需要决策时以及标签向量。程序比较测试数据和决策树上的数值，递归执行直到进入叶子节点。这篇文章主要使用决策树...
python决策树实现鸢尾花分类
2023-11-15 20:16

这个项目是基于 Python 编写的，使用决策树算法对鸢尾花数据集进行分类。决策树是一种常用的监督学习算法，适用于分类和回归问题。在这个项目中，我们主要关注鸢尾花分类任务。项目介绍：数据集：项目使用经典...
机器学习-决策树（以西瓜数据集为例）
2023-03-30 09:22

首先，我们需要导入必要的Python库，如pandas用于数据处理，sklearn库中的DecisionTreeClassifier用于构建决策树模型，以及matplotlib和seaborn用于数据可视化。数据集通常以CSV或Excel格式存储，因此我们可以使用...
决策树算法实现(使用MNIST数据集)_Python环境
2020-09-11 16:34

决策树算法是机器学习领域中一种简单而有效的分类方法，尤其适用于初学者和数据分析任务。在本项目中，我们将利用Python3环境，结合MNIST数据集来实践决策树的实现。MNIST数据集是一个广泛使用的手写数字识别数据集...
c4.5基于信息增益比的多分类决策树python实现
2017-12-08 10:57

C4.5决策树是一种广泛使用的机器学习算法，主要用于分类任务。它是由Ross Quinlan开发的，是对ID3算法的改进，...通过理解C4.5算法的原理和Python实现，我们可以更好地理解和应用决策树模型，从而解决复杂的分类问题。
python实现决策树分类
2020-09-20 03:19

总的来说，Python实现决策树分类涉及到数据处理、信息熵计算、特征选择和递归构建决策树等多个步骤。在实际应用中，还需要考虑算法的效率和优化，比如使用剪枝技术来防止过拟合。通过这种方式，我们可以构建出一个能...
【python代码实现】决策树分类算法
2022-04-11 20:39

貮叁的博客目录模拟数据决策树分类算法构建数据集绘制决策树代码模拟数据编号年龄收入范围工作性质信用评级购买决策 01 <30 高不稳定较差否 02 <30 高不稳定好否 03 30-40 高不稳定较差是 ...
Python实现决策树C4.5算法的示例
2020-09-20 10:47

完整的C4.5算法实现需要包含完整的函数定义、数据处理逻辑以及决策树的构建过程。在实际应用中，还需要进行数据预处理、模型评估和调优等步骤以达到更好的分类效果。在机器学习领域，决策树是一种常用的分类模型，...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 5月28日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月20日

决策树怎么处理分类标签比较多的数据?

4条回答 默认 最新

问题事件

4条回答默认最新