我在用weka对UCI里面的人口普查的数据进行处理的时候,最后做出来的决策树的宽度很大,从我的数据集本身来看,数据集的某些分类属性的取值有很多,例如国籍这一栏就有十几二十来个取值,所以我想问一下,这种情况下,我可以用什么方法对这些分类属性进行处理,例如将中国,印度,泰国这些国家归为发展中国家,而有不会降低挖掘的准确性呢?求教~~~!
1条回答 默认 最新
悬赏问题
- ¥20 我想使用一些网络协议或者部分协议也行,主要想实现类似于traceroute的一定步长内的路由拓扑功能
- ¥30 深度学习,前后端连接
- ¥15 孟德尔随机化结果不一致
- ¥15 apm2.8飞控罗盘bad health,加速度计校准失败
- ¥15 求解O-S方程的特征值问题给出边界层布拉休斯平行流的中性曲线
- ¥15 谁有desed数据集呀
- ¥20 手写数字识别运行c仿真时,程序报错错误代码sim211-100
- ¥15 关于#hadoop#的问题
- ¥15 (标签-Python|关键词-socket)
- ¥15 keil里为什么main.c定义的函数在it.c调用不了