FlinkCDC exported数据库日志记录内存不释放

背景：使用flinkcdc同步数据库表里的全量数据 +增量数据，先暂时是全量阶段。

现象：
我的表里有84万的数据量，当我使用flinkcdc 来做日志同步历史数据的时候，发现每次都是在Exported data就会报错了：java.lang.OutOfMemoryError: GC overhead limit exceeded

还是在日志收集阶段，都还没消费

我的flinkCdc的配置

我的疑问：
1：flinkcdc的机制是所有的历史数据都加载完了之后才消费的吗？这还是一个84万数据表，如果有1000万以上的，岂不是要求数据量更大，这不太合理，不可能要求内存设置超大吧

2：flinkcdc，怎么做到拉取一批，就发送一批去消费，这样内存就不会堆积了

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
阿里嘎多学长 2025-05-13 16:32
关注
阿里嘎多学长整理AIGC生成，因移动端显示问题导致当前答案未能完全显示，请使用PC端查看更加详细的解答过程

FlinkCDC exported 数据库日志记录内存不释放

你遇到的问题是 FlinkCDC 在 Exported 数据库日志记录时，内存不释放，导致内存占用增加。

可能的原因是 FlinkCDC 在 Exported 数据库日志记录时，使用了大量的内存来存储数据，而没有及时地释放内存。

解决方案：

优化 FlinkCDC 的配置，例如：

flink.cdc.max-queue-size: 100000 flink.cdc.max-queue-size-per-fragment: 10000

这两个配置可以控制 FlinkCDC 的队列大小和每个 fragment 的队列大小，从而减少内存占用。

使用 FlinkCDC 的 async-commit 机制，例如：

flink.cdc.async-commit.enabled: true flink.cdc.async-commit.queue-size: 10000

这两个配置可以使 FlinkCDC 在 Exported 数据库日志记录时，使用异步提交机制，从而减少内存占用。

使用 FlinkCDC 的 batch-commit 机制，例如：

flink.cdc.batch-commit.enabled: true flink.cdc.batch-commit.queue-size: 10000

这两个配置可以使 FlinkCDC 在 Exported 数据库日志记录时，使用批量提交机制，从而减少内存占用。

优化 FlinkCDC 的数据处理逻辑，例如：

FlinkCDC cdc = FlinkCDC.create() .setSource("your-source") .setSink("your-sink") .setBatchSize(10000) .setBatchInterval(1000) .start();

这段代码可以控制 FlinkCDC 的批量处理大小和批量处理间隔，从而减少内存占用。

monitor FlinkCDC 的内存占用情况，使用 Flink 的监控工具，例如：

flink monitor -n <your-job-name> -m memory

这条命令可以监控 FlinkCDC 的内存占用情况，从而快速发现内存占用增加的原因。

需要注意的是，这些解决方案可能需要根据你的实际情况进行调整和组合。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

如何查看crontab的日志记录
2019-06-13 12:01

谦杯的博客如何查看crontab的日志记录在Unix和类Unix的操作系统之中，crontab命令常用于设置周期性被执行的指令，也可以理解为设置定时任务。 crontab中的定时任务有时候没有成功执行，什么原因呢？这时就需要去日志里去...
深度评测PolarDB-X 开源分布式数据库的优势与实践【开发者评测｜PolarDB 开源评测】
2024-07-30 20:28

一键难忘的博客 PolarDB 作为阿里云的核心数据库产品，以其高性能、高可用性和可扩展性在业界享有盛誉。特别是在Gartner的全球云数据库报告中，PolarDB 连续四年稳居“领导者”象限，充分证明了其在技术实力和市场认可度上的优势。...
大数据常见面试问题汇总
2023-07-12 12:50

Bigdata_shit的博客第1章核心技术 1.1 Linux&Shell 1.1.1 Linux常用高级命令序号命令命令解释 1 top 实时显示系统中各个进程的资源占用状况（CPU、内存和执行时间） 2 jmap -heap 进程号查看某个进程内存 3 free -m 查看系统...
postgresql|数据库|数据迁移神器ora2pg的安装部署和初步使用
2023-09-08 11:55

晚风_END的博客有的时候有需求需要迁移Oracle数据库的数据到postgresql，那么，其实可供选择的工具是比较多的，但从迁移效率，准确度这些角度来选择的话，无疑还是GitHub上的开源免费工具ora2pg比较合适的。 ora2pg的优点是免费，...
Linux导入导出Oracle数据库
2024-08-22 21:30

一点都看不懂Java的博客 exp/imp导出导入数据库
10秒，轻松搞定MySQL数据库迁移!
2024-11-16 20:29

chenoracle的博客 1.MySQL 5.7、8.0数据库迁移，从redhat系统迁移到麒麟系统，数据量100GB+，要求业务停机时长
Android14 普通应用registerReceiver注册广播报错One of RECEIVER_EXPORTED or RECEIVER_NOT_EXPORTED should be
2024-04-30 14:54

峥嵘life的博客 Android14 普通应用注册广播registerReceiver会报错，提示需要添加一个参数RECEIVER_EXPORTED 或者 RECEIVER_NOT_EXPORTED；系统framework或者系统应用是不会报这个错误的！这个问题比较好解决，加一个参数就行，...
操作mongdb数据库
2022-12-15 15:52

青阳zi的博客如果该数据库不存在，则创建该数据库。 3 查看数据库 操作语句： show dbs 该命令可以查看有哪些数据库。但是刚刚创建的student数据库并没有显示出来，这是因为需要给student数据库插入一些数据才能显示。 db....
【错误记录】未安装该应用 ( 在 Android 12 之后组件设置 android:exported=“false“ 属性 )
2022-03-18 17:47

韩曙亮的博客文章目录一、报错信息二、解决方案一、报错信息 ... 【错误记录】Manifest 清单文件报错 ( …required to specify an explicit value for android:exported when the … ) AndroidManifest.xml 清单文件内容为 : ...
Android 12 自动适配 exported 深入解析避坑
2022-03-12 09:44

恋猫de小郭的博客众所周知，从 Android 12 开始，使用了 TargetSDK 31 之后，四大组件如果使用了 intent-filter，但是没显性质配置 exported App 将会无法安装，甚至编译不通过。比如启动的 Activity 就需要设置 exported 为 true...
记录解决uniapp使用uview-plus在vue3+vite+ts项目中打包后样式不能显示问题
2024-02-22 23:00

狂野小青年的博客 1. 这里的Vue本地运行正常打包后样式无法正常显示，是由于用npm导入了一部分uniapp的@dcloudio类库，和HBuilder自带的@dcloudio一起用导致版本不一致导致的问题。2. 我们在升级迁移项目中遇到问题，还是要深入分析...
[数据库][oracle]ORACLE EXP/IMP的使用详解
2024-09-05 22:05

awonw的博客其实我从来不认为Exp/Imp是一种好的备份方式，正确的说法是Exp/Imp只能是一个好的转储工具，特别是在小型数据库的转储，表空间的迁移，表的抽取，检测逻辑和物理冲突等中有不小的功劳。表空间传输是8i新增加的一种...
linux 查看定时任务 crontab 日志记录
2020-07-03 17:05

whatday的博客这时就需要去日志里去分析一下了，那该如何查看crontab的日志记录呢？ 1. linux 看 /var/log/cron.log这个文件就可以，可以用 tail -f /var/log/cron.log 观察 2. unix 在 /var/spool/cron/tmp文件中，有...
android默认exported_android:exported 属性详解
2021-03-07 15:28

机器人之路的博客 http://blog.csdn.net/watermusicyes/article/details/46460347昨天在用360扫描应用漏洞时，扫描结果，出来一个android:exported属性，其实之前根本不知道这个属性，更不知道这个属性用来干嘛的，详情见下图：因此，...
C++和Python实现SQL Server数据库导出数据到S3并导入Redshift数据仓库
2025-01-26 23:44

weixin_30777913的博客代码使用异步编程优化数据库读取和文件写入过程，并包含异常处理和日志记录功能。CSV写入： writeToCSV 函数将数据写入CSV文件，包括表头和数据行，并用双引号包裹每个数据，使用逗号作为分隔符。
MongoDB数据库的备份恢复
2022-01-10 13:11

Jiangxl~的博客 MongoDB数据库的备份恢复文章目录MongoDB数据库的备份恢复1.mongodb备份还原工具2.mongoexport备份还原某个库的某张表2.1.备份还原语法格式2.2.创建备份目录2.3.备份某个库的某张表2.4.将某张表指定的字段备份成csv...
oracle不导入表结构,oracle数据库怎么导入dmp，只导入数据不导入表结构？
2021-05-03 09:10

指尖流逝先森的博客使用方法：Exp parameter_name=value or Exp parameter_name=(value1,value2……)只要输入参数help=y就可以看到所有帮助.EXP常用选项1.FULL，这个用于导出整个数据库，在ROWS=N一起使用时，可以导出整个数据库的结构...
详谈MongoDB数据库的备份、还原、导入与导出
2022-03-02 18:51

小眼睛优粥面的博客大家好，我是小眼睛优粥面，此文总结了MongoDB数据库批量迁移与备份操作。
【错误记录】Manifest 清单文件报错 ( ..required to specify an explicit value for `android:exported` when the .. )
2022-03-18 10:22

韩曙亮的博客 Merging Errors: Error: Apps targeting Android 12 and higher are required to specify an explicit value for `android:exported` when the corresponding component has an intent filter defined. See ...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月13日

FlinkCDC exported数据库日志记录内存不释放

4条回答 默认 最新

FlinkCDC exported 数据库日志记录内存不释放

问题事件

4条回答默认最新