夜の雨 2022-04-18 15:40 采纳率: 100%
浏览 153
已结题

clickhouse中查询某值每次变化的时间

问题遇到的现象和发生背景

clickhouse有一fan表 一秒一条数据 表中有存入时间 DS值(int类型变化范围1-6)
求DS每次变化的时间

问题相关代码,请勿粘贴截图

img

我的解答思路和尝试过的方法

查询所有的DS信息 在程序中for循环记录DS值的变化时间
由于表中数据量很大(千万级数据)
接口又是轮巡调用 会很慢

我想要达到的结果

有没有一种方法可以筛选DS字段每次变化的时间(跳过DS字段相同值的数据)
表数据
id | -- creat_time -- | DS |
1 │ 2022-04-05 07:02:01 │ 1
1 │ 2022-04-05 07:02:02 │ 4
1 │ 2022-04-05 07:02:03 │ 1
1 │ 2022-04-05 07:02:04 │ 1
1 │ 2022-04-05 07:02:05 │ 2
1 │ 2022-04-05 07:02:06 │ 2
1 │ 2022-04-05 07:02:07 │ 1
1 │ 2022-04-05 07:02:08 │ 1
1 │ 2022-04-05 07:02:09 │ 4
1 │ 2022-04-05 07:02:10 │ 4
1 │ 2022-04-05 07:02:11 │ 4
1 │ 2022-04-05 07:02:12 │ 4

查询后结果
id | -- creat_time -- | DS |
1 │ 2022-04-05 07:02:01 │ 1
1 │ 2022-04-05 07:02:02 │ 4
1 │ 2022-04-05 07:02:03 │ 1
1 │ 2022-04-05 07:02:05 │ 2
1 │ 2022-04-05 07:02:07 │ 1
1 │ 2022-04-05 07:02:09 │ 4

  • 写回答

1条回答 默认 最新

  • DarkAthena ORACLE应用及数据库设计方案咨询师 2022-04-18 23:44
    关注

    clickehouse支持窗口函数,可以使用lag配合sum来获取变化的位置


    大概像下面这样,我这里没数据环境不好测试。

    select fanId,min(create_time) create_time from (
    select t.*,
    sum(lag) over (PARTITION BY fanId ORDER BY create_time) s from 
    (select id ,create_time, DS ,fanId,
       case when any(DS) OVER (PARTITION BY fanId ORDER BY create_time  ROWS BETWEEN 1 PRECEDING AND 1 PRECEDING) = DS 
       then 0 else 1 end lag 
    from fan) t) t2
    group by fanId,s
    

    原理就是上一行和当前行相等时计为0,不等时计为1,然后使用滑动窗口求和,就能在每次数据变化的时候加1,这样就能把数据按顺序切分开了,再按这个字段group by,就可以取每组最大和最小的时间

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录

报告相同问题?

问题事件

  • 系统已结题 5月3日
  • 已采纳回答 4月25日
  • 修改了问题 4月19日
  • 修改了问题 4月19日
  • 展开全部

悬赏问题

  • ¥50 有数据,怎么建立模型求影响全要素生产率的因素
  • ¥50 有数据,怎么用matlab求全要素生产率
  • ¥15 TI的insta-spin例程
  • ¥15 完成下列问题完成下列问题
  • ¥15 C#算法问题, 不知道怎么处理这个数据的转换
  • ¥15 YoloV5 第三方库的版本对照问题
  • ¥15 请完成下列相关问题!
  • ¥15 drone 推送镜像时候 purge: true 推送完毕后没有删除对应的镜像,手动拷贝到服务器执行结果正确在样才能让指令自动执行成功删除对应镜像,如何解决?
  • ¥15 求daily translation(DT)偏差订正方法的代码
  • ¥15 js调用html页面需要隐藏某个按钮