flink CDC+clickhouse 构成的实时数仓问题

flink CDC+clickhouse 构成的实时数仓中，原始数据通过flinkCDC 同步到clickhouse 形成贴原创，明细层的数据是如何生成呢？
我的理解：明细层数据是要通过贴原层的数据经过join关联而来，这样子明细层似乎没法实时的
我的想法是明细层直接建视图，但是视图确实不如实体表方便，
还有就是，我数据有多个来源系统，假设每个系统都有客户数据要计算并写入明细层的客户信息表，明细层如果是一张实体表，写入性能上会不会是瓶颈

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
yule.yang 2024-01-23 10:55
关注
在使用Flink CDC和ClickHouse构建实时数仓时，确实需要仔细考虑明细层数据的生成方式。

首先，你的理解是正确的，明细层数据通常是通过对贴原创层的数据进行join等关联操作而来的。这种方式有助于将原始数据进行整合，形成更加具体和详细的信息。

关于你提到的实时性问题，确实在使用join等关联操作时可能会导致明细层数据无法实时生成。一种解决方案是采用流处理的方式，将Flink的流处理能力应用于数据的实时处理和计算，以实现更快的数据更新。这样可以在一定程度上提高实时性。

关于明细层是否直接建视图的问题，视图的确可以提供一种方便的方式来查看和处理数据，但是你已经指出，相比实体表，视图在性能上可能有一些损失。因此，在权衡方便性和性能的时候，需要根据具体情况做出选择。

至于多个来源系统的数据写入性能问题，如果每个系统都有客户数据要计算并写入明细层的客户信息表，确实可能会引起性能瓶颈。在这种情况下，你可以考虑以下几个方面：

分区表： 如果可能，可以将实体表按照一定的规则进行分区，以减轻写入的压力。
批处理和定时任务： 不是所有的数据都需要实时写入，可以考虑将一些计算较为复杂的数据以批处理或者定时任务的方式进行写入，降低实时计算的压力。
缓存： 对于一些频繁查询的数据，可以考虑使用缓存来提高查询性能。

总体来说，明细层数据生成的方式需要综合考虑实时性、方便性和性能，根据具体业务需求进行权衡和选择。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

基于Flink+FlinkCDC+FlinkSQL+Clickhouse构建实时数据仓库2022
2022-10-26 10:14

分享一套flink实时数仓的课程——《基于Flink+FlinkCDC+FlinkSQL+Clickhouse构建实时数据仓库》，2022年10月完结的新课，课程基于flink1.14版本，视频+源码+课件+软件包，一起提供下载！
基于Flink+FlinkCDC+FlinkSQL+Clickhouse构建实时数据仓库课程
2022-10-26 10:30

在构建实时数据仓库的过程中，Flink、FlinkCDC、FlinkSQL和Clickhouse这四个关键技术起着至关重要的作用。本文将深入探讨这些技术，并结合2022年新课中的内容，详细介绍如何利用它们构建高效的实时数据处理系统。 ...
梯度科技基于Flink+Clickhouse构建实时数仓在广投集团的最佳实践（转）
2021-05-15 10:54

进击的Z同学的博客文章目录一、业务背景二、常见的实时数仓方案三、为什么选择Flink+Clickhouse四、实时数仓1.0五、踩过的“坑”六、实践展望-实时数仓2.0 原作者信息：刘伟平，梯度科技技术专家、大数据技术负责人，主要负责大数据...
从零搭建实时数仓：基于Flink+ClickHouse的实践
2025-08-30 12:20

AIGC应用创新大全的博客实时数据处理和实时数据查询。市场上的技术方案众多，为何选择Flink+ClickHouse？
如何巧用 Flink+Clickhouse 构建高性能实时数仓？
2024-04-19 15:26

SelectDB技术团队的博客 Flink 和 ClickHouse 都是用于构建实时数据仓库的优秀工具。Flink 是一个用于流处理的开源框架，而 ClickHouse 则是一个用于实时数据仓库的高性能列存储数据库。Flink 是 ClickHouse 的最佳搭档，为什么这么说呢？
实时数仓：数据湖 + Flink当前实时数仓中非常主流且高效的方案之一
2025-01-02 16:10

PersistDZ的博客是的，是当前实时数仓中非常主流且高效的方案之一，特别是在需要处理海量数据、实时分析和低延迟查询的场景下。这种方案结合了数据湖的弹性存储能力和 Flink 的强大实时计算能力，解决了传统数据仓库在实时性和灵活...
流计算 Oceanus | 巧用 Flink 构建高性能 ClickHouse 实时数仓
2021-12-29 01:42

腾讯云大数据的博客令 Flink 与 ClickHouse 各取所长，构造高质量、高效率、面向未来的数仓平台。
Hologres+Flink企业级实时数仓核心能力介绍
2024-07-12 09:29

阿里云大数据AI技术的博客 Hologres+Flink企业级实时数仓核心能力介绍
Clickhouse+Spark+Flink一体化实时数仓（开源）
2021-12-17 11:06

qq_37401291的博客 Clickhouse+Spark+Flink一体化实时数仓（开源）
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月23日

flink CDC+clickhouse 构成的实时数仓问题

1条回答 默认 最新

问题事件

1条回答默认最新