做数据挖掘前，需要把连续性数据离散化，在某个区间内归为1，2等，编程语言该怎么实现？

比如在240~250内的为1，250~260内的为2，260~270内的为3，该怎么实现啊

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
ChatGPTᴼᴾᴱᴺᴬᴵ 2023-02-28 12:33
关注
该回答引用ChatGPT

在大多数编程语言中，可以使用以下步骤将连续性数据离散化：

定义区间和对应的离散化数值：首先，定义一个包含每个区间和对应离散化数值的字典。对于给定的示例，可以定义如下：

discretization_bins = { (240, 250): 1, (250, 260): 2, (260, 270): 3 }

对于每个数据点，找到它所在的区间：对于每个连续性数据点，遍历区间字典，找到该点所在的区间。

分配对应的离散化数值：将该数据点的离散化数值设置为其所在区间的对应数值。

下面是一个Python示例代码，演示如何实现该过程：

def discretize(value, bins): # 遍历区间字典 for bin_range, bin_value in bins.items(): # 如果该值在区间内，返回对应离散化数值 if value >= bin_range[0] and value < bin_range[1]: return bin_value # 如果该值不在任何区间内，返回空值或者默认值 return None # 测试 value = 245 discretization_bins = { (240, 250): 1, (250, 260): 2, (260, 270): 3 } discretized_value = discretize(value, discretization_bins) print(discretized_value) # 输出: 1

在这个示例中，discretize() 函数接收一个数据点和一个区间字典，返回该数据点对应的离散化数值。在测试代码中，输入的 value 值为 245，该函数返回的结果为 1，因为该值在 (240, 250) 区间内，对应的离散化数值为 1。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

如何用UCI数据集测试基于卡方分裂的离散化方法？Python实习 python 算法
2023-04-21 12:56

回答 2 已采纳最近我也在看着块，我把我的方法说一下可以从UCI数据集中选择适当的数据集进行实验，并与其他离散化算法进行比较。首先，需要对数据集进行预处理，包括数据清洗、特征选择和标准化等步骤。然后，可以使用不同的离
【请教】根据已有数据生成类似该数据分布的新数据人工智能数据挖掘机器学习
2020-08-22 14:04

回答 3 已采纳看你是离散型数据还是连续数据。离散型数据可以随机在你原有的数据（假设是n）中随机取[0,n)中取一个下标，得到一个数据。重复你要的次数，得到样本。连续数据可以先对原来的数据插值，再随机采样。
如何证明离散点集的正交性大数据数据挖掘
2022-07-07 15:02

回答 2 已采纳最关键的就是如何证明等于零，感觉等与零，一直没有严格的证明过程。想到把三角函数转化成e为底的复变函数就很简单了，在空间上是一个绕圆一周的向量。自己解决了，把过程写下来，供大家参考吧
终于有人把数据挖掘讲明白了
2021-03-03 15:08

hzbooks的博客 01什么是数据挖掘数据挖掘（DataMining）应该是一门大家都听说过，但又不太容易说清楚的课程。在数据科学领域，乃至在更大的计算机科学领域，数据挖掘就好比山东蓝翔，大家不一定都知道挖...
实现离散性插值的过程中怎么解决数据阶跃问题？
2016-09-13 15:38

回答 1 已采纳 http://wenku.baidu.com/link?url=255ri8dFKkRNjek7uNEpfDWHnBDvA-VWAM4ufEX-U5AFyViRXjuR1CJMDVhfSQSzwc6k
怎么才能从差分格式的数据中读取并恢复为连续离散序列？
2016-09-08 07:38

回答 1 已采纳 http://blog.csdn.net/hit1524468/article/details/48792279
JAVA 数据挖掘 决策树 java 数据挖掘
2015-08-11 11:24

回答 1 已采纳 [_数据挖掘_] 决策树----------------------同志你好，我是CSDN问答机器人小N，奉组织之命为你提供参考答案，编程尚未成功，同志仍需努力！
Python数据分析与挖掘实战总结
2021-02-05 14:12

GoAI的博客《Python数据分析与挖掘实战》书籍笔记，包含每章节总结及对应代码，可供python数据分析与数据挖掘资料使用，另外包括数据挖掘比赛笔记总结。
MATLAB中队三维离散数据进行曲面拟合 matlab
2022-03-23 09:48

回答 2 已采纳你就不能用scatteredInterpolant吗，这个函数更好哦 a=[ 3 3 1.5300 3 27 0.4210 5 17 0.5980 9 9 0.5900 13 25 0.4470 15
java密码系统解密问题（离散数据竞赛平台） java
2022-05-12 22:22

回答 2 已采纳我是没看出来，这个明文和密文之间的关系，所以采用了硬编码的形式 public static void main(String[] args) { Map<String, Stri
matlab截取离散数据点图像中的其中一段数据 matlab
2021-10-29 09:59

回答 1 已采纳假设信号的时间是t信号是y y1 = movstd(y,20); y2 = y1>1.5*y1(1); p = find(y2); q = p(1); r = find(min(y)==y) t
数据产品化：将数据转换为商业价值
2023-07-27 00:35

禅与计算机程序设计艺术的博客基于以上需求，本文通过介绍数据产品化的相关概念和方法论，重点阐述了数据产品化的理念、流程及工具，以及该方法在实际场景中的应用，以及其未来的发展方向和展望。在阅读完毕后，读者应该对数据产品化有个基本的...
怎么用Python或者R求某个变量的数学期望？ python r语言有问必答
2022-04-04 21:37

回答 2 已采纳等概率的直接用mean函数就可以，不等概率的就用矩阵点乘就可以.dot
数据可视化之R语言篇
2023-08-08 01:19

禅与计算机程序设计艺术的博客数据可视化是数据分析中的重要一环，也是数据挖掘、机器学习等相关领域的基础性工具。R语言在数据可视化方面也扮演着越来越重要的角色，它是一个非常强大的统计分析和绘图软件包。本文将以R语言为工具，从基础概念到...
数据挖掘课程实验 1：数据预处理
2024-04-07 12:02

Conn_w的博客了解了数据预处理的方法和主要步骤，依靠在教材的基础上查询网上的资料，学习了相关数据预处理的算法过程，并完成了对数据预处理方法的具体案例实现，基本掌握了数据预处理的主要过程，为未来的数据挖掘提供准备过程...
没有解决我的问题, 去提问

悬赏问题

¥15 YoloV5 第三方库的版本对照问题
¥15 请完成下列相关问题！
¥15 drone 推送镜像时候 purge: true 推送完毕后没有删除对应的镜像,手动拷贝到服务器执行结果正确在样才能让指令自动执行成功删除对应镜像，如何解决？
¥15 求daily translation（DT）偏差订正方法的代码
¥15 js调用html页面需要隐藏某个按钮
¥15 ads仿真结果在圆图上是怎么读数的
¥20 Cotex M3的调试和程序执行方式是什么样的？
¥20 java项目连接sqlserver时报ssl相关错误
¥15 一道python难题3
¥15 牛顿斯科特系数表表示

做数据挖掘前，需要把连续性数据离散化，在某个区间内归为1，2等，编程语言该怎么实现？

1条回答 默认 最新

悬赏问题

1条回答默认最新