数据挖掘中数据处理的问题

我在用weka对UCI里面的人口普查的数据进行处理的时候，最后做出来的决策树的宽度很大，从我的数据集本身来看，数据集的某些分类属性的取值有很多，例如国籍这一栏就有十几二十来个取值，所以我想问一下，这种情况下，我可以用什么方法对这些分类属性进行处理，例如将中国，印度，泰国这些国家归为发展中国家，而有不会降低挖掘的准确性呢？求教~~~！

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
devmiao 2017-04-15 10:18
关注
http://blog.csdn.net/lizhengnanhua/article/details/8982968

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

数据挖掘中数据的处理 python 数据分析
2022-12-15 11:33

回答 1 已采纳上面的错误信息提示是说，你的输入文件地址不存在，你确认一下你的文件是不是在这个路径呢。或者你简单一点处理，把文件挪到当前运行代码的同级目录下，就不用加一堆路径前缀了，直接用文件名就可以。
数据挖掘学习规划建议人工智能数据挖掘有问必答机器学习
2022-11-11 13:27

回答 4 已采纳 1. 计算机科学基础和编程 2. 概率论和数理统计 3. 数据建模及评估 4. 应用机器学习算法和库 5. 软件工程和系统设计工程能力（ 1 ）编程基础：需要掌握一大一小两门语言，大的指 C++
python在数据挖掘中依靠pandas进行excel操作的问题 writer = pd.ExcelWriter python 人工智能数据挖掘有问必答
2021-11-18 15:15

回答 1 已采纳试试在writer中添加 mode='a'看看如何，writer = pd.ExcelWriter(filename, engine='openpyxl', mode='a')
数据挖掘中海量数据处理算法的研究与实现.doc
2022-05-11 21:32

数据挖掘中海量数据处理算法的研究与实现.doc
请问数据挖掘要学什么？数据挖掘
2022-12-18 11:34

回答 2 已采纳 01 什么是数据挖掘 数据挖掘（Data Mining）应该是一门大家都听说过，但又不太容易说清楚的课程。在数据科学领域，乃至在更大的计算机科学领域，数据挖掘就好比山东蓝翔，大家不一定都知道挖掘机要怎
fortran 中除法的数据精度问题大数据开发语言数据挖掘
2022-07-06 10:45

回答 2 已采纳单精度数据只有6-7位有效数字，所有语言都这样。双精度15位有效数字。
如何处理数据类型问题？ python windows 数据挖掘有问必答
2021-07-07 19:37

回答 2 已采纳字面意思，你送入强转类型方法float()的变量，应该是一个数字或者字符串，而不是一个方法指针。。。由上到下执行的话，倒数第二步运行到np.asarray(array,order=order,dtyp
NLP：数据挖掘之唐诗分析程序.zip
2022-04-21 10:45

随着Java的发展，提供了流式处理（Stream）数据的能力，以及数据挖掘也是近年来比较热门的技术职业发展方向。通过初步学习，研究简单的数据采集，清洗，存储和分析，了解整个数据挖掘的基本流程。 3. 意义了解数据...
数据挖掘 决策树分类结果报错 python 决策树数据挖掘
2022-11-27 16:16

回答 2 已采纳额，好吧，你重新提交了一个问题，那就在这个问题上跟进你的解决情况吧
求解答数据挖掘三道题数据挖掘
2022-05-24 09:48

回答 2 已采纳 数据挖掘题，应该是手写解答过程和手算的题，不需要编程吧。我写个 =============1，该数据的均值为就是数据的总和/数据的个数=30.35，中位数有序集合的中间值，即25。该数据的众数为25和
数据挖掘分类中关于分类器评估度量的一道题数据挖掘
2018-12-18 14:57

回答 1 已采纳由图可知正元组有5个，负元组有5个，所以P=5，N=5。（1）由元组1开始，该元组具有最高的概率得分，取该得分为阈值，即t=0.95，这样，分类器认为大于等于t的为正元组，故元组1为正，而其他元组
数据挖掘与人工智能技术.pdf
2021-07-10 23:24

数据挖掘与人工智能技术.pdf
python脚本解决时间戳对不齐问题，处理数据 python 数据分析数据挖掘有问必答
2021-09-28 18:35

回答 1 已采纳参考 pandas中的几种合并DataFrame的方法_学习python-CSDN博客我们知道，在使用pandas处理数据的时候，往往会需
数据挖掘商务智能海底捞运营分析含分析步骤、数据处理过程
2022-11-06 13:03

数据挖掘商务智能海底捞火锅运营分析 | 含分析步骤、数据处理过程，是学习数据处理的基础
大数据与数据挖掘技术 人工智能NLP自然语言处理技术研究问句中并列结构的识别共18页.pptx
2022-02-03 12:05

一、问题及相关研究二、解决方法三、试验结果并列结构是语言信息处理中的难点，一般认为并列成分是相似的。通过计算并列成分的相似性来解决。句子层面短语层面
没有解决我的问题, 去提问

悬赏问题

¥20 我想使用一些网络协议或者部分协议也行，主要想实现类似于traceroute的一定步长内的路由拓扑功能
¥30 深度学习，前后端连接
¥15 孟德尔随机化结果不一致
¥15 apm2.8飞控罗盘bad health，加速度计校准失败
¥15 求解O-S方程的特征值问题给出边界层布拉休斯平行流的中性曲线
¥15 谁有desed数据集呀
¥20 手写数字识别运行c仿真时，程序报错错误代码sim211-100
¥15 关于#hadoop#的问题
¥15 (标签-Python|关键词-socket)
¥15 keil里为什么main.c定义的函数在it.c调用不了

数据挖掘中数据处理的问题

1条回答 默认 最新

悬赏问题

1条回答默认最新