Liuhuiqi_123456 2021-04-27 19:33 采纳率: 0%
浏览 1005

clickhouse如何去掉重复数据?

a,每天2份指标数据,上午的是新增,下午的是更新数据(有补数有新增,但是99%都是重复的数据)

b, 采用ReplacingMergeTree存储引擎,但是合并数据操作是后台不定时执行,在这期间会有重复数据,查询的时候会重复

c,如果解决改从哪方面入手,1落地的时候执行OPTIMIZE语句(阻塞?数据量大的时候会不会失效?每个月大概1千万的数据量)2、查询的时候用final 效率太低

有没有更好的解决方案

  • 写回答

4条回答 默认 最新

  • 关注

    把未处理的数据临时保存在hashmap里面效率是否比较高呢。

    评论

报告相同问题?

悬赏问题

  • ¥15 VS2022 C++的相关代码问题咨询
  • ¥15 如果要做一个老年人平板有哪些需求
  • ¥15 k8s生产配置推荐配置及部署方案
  • ¥15 matlab提取运动物体的坐标
  • ¥15 人大金仓下载,有人知道怎么解决吗
  • ¥15 一个小问题,本人刚入门,哪位可以help
  • ¥30 python安卓开发
  • ¥15 使用R语言GD包一直不出结果
  • ¥15 计算机微处理器与接口技术相关问题,求解答图片的这个问题,有多少个端口,端口地址和解答问题的方法和思路,不要AI作答
  • ¥15 如何根据一个截图编写对应的HTML代码