YUIKI_ready 2017-04-15 09:04 采纳率: 0%
浏览 929

数据挖掘中数据处理的问题

我在用weka对UCI里面的人口普查的数据进行处理的时候,最后做出来的决策树的宽度很大,从我的数据集本身来看,数据集的某些分类属性的取值有很多,例如国籍这一栏就有十几二十来个取值,所以我想问一下,这种情况下,我可以用什么方法对这些分类属性进行处理,例如将中国,印度,泰国这些国家归为发展中国家,而有不会降低挖掘的准确性呢?求教~~~!

  • 写回答

1条回答 默认 最新

  • devmiao 2017-04-15 10:18
    关注
    评论

报告相同问题?

悬赏问题

  • ¥20 我想使用一些网络协议或者部分协议也行,主要想实现类似于traceroute的一定步长内的路由拓扑功能
  • ¥30 深度学习,前后端连接
  • ¥15 孟德尔随机化结果不一致
  • ¥15 apm2.8飞控罗盘bad health,加速度计校准失败
  • ¥15 求解O-S方程的特征值问题给出边界层布拉休斯平行流的中性曲线
  • ¥15 谁有desed数据集呀
  • ¥20 手写数字识别运行c仿真时,程序报错错误代码sim211-100
  • ¥15 关于#hadoop#的问题
  • ¥15 (标签-Python|关键词-socket)
  • ¥15 keil里为什么main.c定义的函数在it.c调用不了