fengbiqunluan 2016-04-10 08:12 采纳率: 0%
浏览 1165

做数据挖掘前,需要把连续性数据离散化,在某个区间内归为1,2等,编程语言该怎么实现?

比如在240~250内的为1,250~260内的为2,260~270内的为3,该怎么实现啊图片说明

  • 写回答

1条回答 默认 最新

  • ChatGPTᴼᴾᴱᴺᴬᴵ 2023-02-28 12:33
    关注

    该回答引用ChatGPT

    在大多数编程语言中,可以使用以下步骤将连续性数据离散化:

    • 定义区间和对应的离散化数值:首先,定义一个包含每个区间和对应离散化数值的字典。对于给定的示例,可以定义如下:

      discretization_bins = {
        (240, 250): 1,
        (250, 260): 2,
        (260, 270): 3
      }
      
    • 对于每个数据点,找到它所在的区间:对于每个连续性数据点,遍历区间字典,找到该点所在的区间。

    • 分配对应的离散化数值:将该数据点的离散化数值设置为其所在区间的对应数值。

    下面是一个Python示例代码,演示如何实现该过程:

    def discretize(value, bins):
        # 遍历区间字典
        for bin_range, bin_value in bins.items():
            # 如果该值在区间内,返回对应离散化数值
            if value >= bin_range[0] and value < bin_range[1]:
                return bin_value
        # 如果该值不在任何区间内,返回空值或者默认值
        return None
    
    # 测试
    value = 245
    discretization_bins = {
        (240, 250): 1,
        (250, 260): 2,
        (260, 270): 3
    }
    discretized_value = discretize(value, discretization_bins)
    print(discretized_value)  # 输出: 1
    

    在这个示例中,discretize() 函数接收一个数据点和一个区间字典,返回该数据点对应的离散化数值。在测试代码中,输入的 value 值为 245,该函数返回的结果为 1,因为该值在 (240, 250) 区间内,对应的离散化数值为 1。

    评论

报告相同问题?

悬赏问题

  • ¥15 YoloV5 第三方库的版本对照问题
  • ¥15 请完成下列相关问题!
  • ¥15 drone 推送镜像时候 purge: true 推送完毕后没有删除对应的镜像,手动拷贝到服务器执行结果正确在样才能让指令自动执行成功删除对应镜像,如何解决?
  • ¥15 求daily translation(DT)偏差订正方法的代码
  • ¥15 js调用html页面需要隐藏某个按钮
  • ¥15 ads仿真结果在圆图上是怎么读数的
  • ¥20 Cotex M3的调试和程序执行方式是什么样的?
  • ¥20 java项目连接sqlserver时报ssl相关错误
  • ¥15 一道python难题3
  • ¥15 牛顿斯科特系数表表示