大数据之湖仓一体，未来如何发展

你用过paimon和amoro

Paimon 整体的优势：

1、Paimon 基于数据湖 + LSM，有很强的 Upsert 更新能力，有天然的 DataSkipping 能力。

2、Paimon 从 Flink 中孵化出来，支持 Flink SQL 所有特性，包括 Flink CDC，Spark 也是生态中必须的一环，所以 Paimon 从一开始就面向多计算引擎。

3、Paimon 原生面向实时数据湖场景进行设计，能够大幅提升数据湖全链路的数据新鲜度，快速迭代，快速发展。

4、Paimon 项目由国人发起和主导，具备更好的本地化支持 (请加钉钉讨论群)。

最大的好处其实还是没有包袱，从零设计的向前走，流式数据湖到今天依然有非常多的问题需要解决，如果是拉着大车往前走，走的很慢，走的很艰难，而 Paimon 的使命只有一个：流式数据湖。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
檀越@新空间 2024-04-02 14:24
关注
下午好🌅🌅🌅
本答案参考ChatGPT-3.5

大数据湖仓一体的发展方向主要包括以下几个方面：

增加数据湖的实时性和数据新鲜度：实时数据湖能够及时处理和分析新产生的数据，从而为企业提供及时的决策支持。为了实现实时数据湖，可以采用流式计算引擎如Flink、Spark等，结合数据湖架构进行设计，保证数据的及时性。

提升数据湖的数据存储和访问效率：数据湖仓一体需要具备高效的数据存储和访问能力。可以采用基于数据湖建模的LSM存储引擎，通过Upsert更新能力和DataSkipping技术来提升数据的存储和访问效率。

支持多计算引擎：为了适应不同的计算需求，数据湖仓一体需要支持多种计算引擎，如Flink SQL、Spark等。这样可以在不同的场景下使用合适的计算引擎，提供更好的计算能力。

本地化支持和集成生态：数据湖仓一体项目由国人发起和主导，可以提供更好的本地化支持。同时，与大数据生态系统的其他组件如Hadoop、Hive、HBase等进行集成，实现数据的无缝交互和共享。

综上所述，数据湖仓一体的未来发展应该注重实时性、存储和访问效率的提升，支持多计算引擎，同时提供本地化支持和与生态系统的集成。
解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

湖仓一体是大数据的未来吗？.pdf
2022-03-18 09:25

这些挑战需要通过技术创新和最佳实践来逐步解决，以推动湖仓一体在大数据领域的广泛应用和持续发展。作为大数据的未来趋势，湖仓一体将在企业数字化转型和数据驱动的决策支持中扮演越来越重要的角色。
大数据建设与湖仓一体化
2025-07-24 13:40

张3蜂的博客湖仓一体化（Lakehouse Architecture）是一种将数据湖的灵活存储与数据仓库的高性能分析能力融为一体的新型数据架构。核心理念是：让所有数据（结构化、半结构化、非结构化）统一存储于数据湖。在数据湖之上构建数据...
湖仓一体是大数据的未来吗？-9.9.pdf
2022-04-29 10:45

eBay OLAP技术专家讲述湖仓一体的现状以及选型，比通过比较主流数仓一体的技术方案，指出大数据未来的方向
融合趋势下基于 Flink Kylin Hudi 湖仓一体的大数据生态体系.pdf
2022-03-18 09:24

在当前的大数据生态环境中，融合趋势正在引领技术发展，其中Flink、Kylin和Hudi等工具在构建湖仓一体的解决方案中发挥着关键作用。本文将深入探讨这些技术及其在构建高效、灵活的数据生态体系中的应用。首先，...
湖仓一体构建大数据中台及解决方案.pptx
2024-05-20 08:48

随着技术的不断发展和应用场景的不断拓展，湖仓一体架构将在未来的数字化转型中发挥更加重要的作用。对于企业而言，构建一个基于湖仓一体架构的大数据中台，不仅能够加速数字化转型的步伐，还能够为企业带来更多的...
2024最新大数据架构趋势：云原生与湖仓一体实战指南
2026-02-13 19:17

AI量化价值投资入门到精通的博客趋势：2024年大数据架构的核心趋势是“云原生+湖仓一体”，解决传统架构的“数据分散、实时性差、成本高”等问题；云原生：通过容器化、K8s、Serverless等技术，实现大数据集群的弹性伸缩和自动化运维；湖仓一体：将...
湖仓一体：数据未来之路
2024-12-31 10:05

像豆芽一样优秀的博客湖仓一体架构是针对数据存储的一种架构,主要还是针对企业级系统大数据存储及治理的一种架构方案。
【大数据领域】基于5V特征与湖仓一体架构的技术体系解析：产业链全景及政务金融应用场景设计
2025-11-07 15:34

文章回顾了国内外大数据的发展历程，梳理了从数据库起步到数据湖、湖仓一体的技术演进路径，并分析了大数据在制造、金融、政务等领域的应用价值与产业布局。同时，深入讲解了Hadoop、HDFS、MapReduce、Spark、HBase...
企业数字化转型大数据湖一体化运营管理平台建设方案.pptx
2024-09-12 16:38

在当今这个信息时代，大数据已经成为了企业和行业竞争的新焦点，而大数据湖作为管理大数据的重要架构概念，其一体化运营管理平台的建设成为了企业数字化转型的关键一步。大数据湖的建设理念最早由Pentaho首席技术官...
湖仓一体大数据平台：开启企业数据管理新时代（附Hudi案例）
2024-08-27 20:05

臻成AI大模型的博客湖仓一体大数据平台：开启企业数据管理新时代（附Hudi案例）
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月2日

大数据之湖仓一体，未来如何发展

你用过paimon和amoro

4条回答 默认 最新

问题事件

4条回答默认最新