Weka分类分析一个有14个属性的数据集,选择“use training set”生成的J48决策树怎么只有三个属性在上面?正常吗?一般决策树分类分析数据的流程是什么样的?谢谢!
16条回答 默认 最新
关注
获得0.45元问题酬金 引自强大而免费的微信小程序:皆我百晓生。
在使用Weka分类分析数据时生成的J48决策树只有三个属性在上面是正常的。J48算法是一种基于递归分区的决策树算法,它通过选择最佳的属性进行分割,并递归地在每个分割的子集上构造子树。在生成决策树时,J48算法会选择对目标变量分类最有帮助的属性。
对于决策树分类分析数据的一般流程,可以按以下步骤进行:
- 导入数据集:使用Weka导入要进行分类分析的数据集。
- 数据预处理:对于存在缺失值、异常值或不必要的属性等问题,需要进行数据清洗和预处理。
- 特征选择:对于可能存在的大量属性,需要进行特征选择,选择对分类最有帮助的属性。
- 构建决策树:在Weka中选择分类算法(如J48)和相关参数,使用训练集构建决策树模型。
- 模型评估和调优:使用测试集对构建好的决策树模型进行评估,检查其分类准确率和性能表现,如果有需要,可以调整算法参数或使用交叉验证等方法进行模型调优。
- 预测和应用:对新的、未知的数据应用决策树模型,进行分类预测。
以上是一般的决策树分类分析数据的流程,具体可以根据数据集的情况和需求进行调整和优化。
解决 无用评论 打赏 举报 编辑记录