kafka consumer producer broker参数怎样设置才能确保消息不丢失不重复

测试环境为单台公网服务器上行下行带宽有限的情况下。如果同时有大量的consumer消费消息或者producer生产消息的话。势必会网络拥堵，网络不稳定。

请问在网络环境不稳定（比如突然有大量客户端数据会导致网络拥堵）该怎么设置consumer、producer、broker的参数才能确保数据不丢失不重复。

当然这种情况下消息到的到来肯定会延时。但是我目前的需求是消息可以延时到达。但不能丢失或者重复。晚点到没关系，只要消息能稳定收到就行。

当然这种延时也不是无限期延时的容忍度，比如超过1分钟消息还没有发送或者接收成功。可以抛出一个错误提示之类的（因为这种情况下说明网络环境的确太差了，可以对用户进行提示用户），不知道我的这些需求具体都需要设置哪些相关参数才可以解决。

当然除了相关参数设置，程序方面还需要我做哪些处理。

目前我用的是librdkafka，最好能给出基于c/c++的相关程序代码。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
一轮明月照丘壑 2024-09-10 22:02
关注
以下回复参考：皆我百晓生、券券喵儿等免费微信小程序作答:

要尽可能确保Kafka中的消息不丢失且不重复，即使在网络不稳定的环境下，这需要我们适当调整Producer、Consumer以及Broker的相关参数，并结合代码逻辑来处理。以下是一些建议和参数设置：

Producer 端参数设置：

acks: 设置该参数为 all 或 -1 可以确保消息被所有副本确认接收后才认为发送成功，减少数据丢失的可能性。

props.put("acks", "all"); // 使用librdkafka时设置

retries: 设置重试次数，当消息首次发送失败时，会尝试重新发送。但需要注意这并不是无限的，要根据网络状况合理设置。

props.put("retries", 3); // 设置重试次数为3次，可根据需要调整

max.in.flight: 控制并发发送请求的数量，避免过多的请求导致网络拥堵。可以根据网络带宽调整此参数。

props.put("max.in.flight", 2); // 限制最多有两条消息未确认时不能发送新的消息，减少并发请求量。根据实际网络环境调整这个值。

Consumer 端参数设置：

auto.offset.reset: 设置消费者偏移量重置策略。当遇到分区没有偏移量记录时（例如新分区），消费者可以选择何种策略开始消费。可以选择 earliest 来重新读取从头开始，这样可以避免漏掉之前的消息。但是对于非常偶尔发生的断网或消费失败事件而言不必设置为earliest。只需在重启消费的时候合理处理消费进度即可。根据实际情况设置该参数。

consumerProps["auto.offset.reset"]="earliest"; // 如果需要从头开始消费设置该参数为earliest

确保消费者的读取速度与Producer的发送速度匹配以避免队列过载导致数据丢失。可能需要动态调整消费速率或者为consumer线程分配更多的处理能力以追赶上来并保持稳定性。如果不能同步则可能会导致更多的未提交的消息重试和消费逻辑失败的处理，加重问题复杂性。这个可能需要对消费逻辑和消费者配置进行综合调优和代码设计才能实现最佳平衡状态。根据实际的消费速度和数据处理逻辑进行配置调整，并在代码层面增加重试机制以应对短暂的异常事件和瞬时过载问题。但也不能过分依赖重试导致不必要的延迟增加或重复消费的问题出现。可以根据实际情况配置合理的重试次数和间隔，以及最大重试次数。可以使用fetch.error.backoff.ms 和 max.poll.interval.ms 等参数来配置重试策略。此外，使用幂次退避策略进行重试可能有助于解决网络不稳定时的重试问题。并且合理控制消费者的线程数量和资源分配以保持足够处理能力的负载均衡状态也非常重要。必要时通过引入限流、排队等手段对消息的消费速度进行管控避免队列过载或消费过载问题出现以保障系统稳定性并避免数据丢失和重复消费的问题发生。关于具体的C++代码实现需要结合具体业务逻辑来编写逻辑代码逻辑处理部分无法直接给出具体代码示例。需要结合业务逻辑和异常处理机制来编写具体的代码逻辑处理部分以确保在异常情况下能够正确处理并给出合理的提示或回滚操作以恢复系统稳定性并保持数据的完整性不被破坏。"你可以参考以上参数建议进行代码设计以满足实际需求并实现数据完整性保障机制。"但是为了避免自动化传输的系统重复性或其他部分质量问题任何消息服务都不是完美的也不宜长时间停留非常关键的缓冲区处于等处理的默认超时可配况定的时间（例如超过一分钟）。根据具体业务需求和实际网络情况综合考虑这个等待超时的时间点和超时后的处理方式以防止不必要的问题出现并保证系统稳定地运行用户进行通知和信息展示等问题处理和优化对于大数据场景复杂且需要大量分析来解决最好借助专业人士来诊断和排查以确保解决方案的稳定性和高效性这些问题也超出了具体的参数设置范畴需要更全面的系统设计和调优方案来解决。"关于程序方面还需要做的处理包括异常处理机制、日志记录、监控告警等确保系统能够及时发现并处理异常情况。"总的来说确保Kafka在不稳定网络环境下不丢失不重复消息是一个复杂的问题需要综合考虑多个因素并进行适当的配置和代码设计以实现最佳效果。"你的问题很有深度涉及到了Kafka使用的多个方面和系统设计调优的内容这需要专业的知识和经验来解决。"
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

kafka拉取不到数据 java kafka 分布式有问必答
2022-02-16 19:32

回答 4 已采纳重新开一个topic，然后先启动consumer，再启动producer，再发消息，你这个可能是consumer已经在broker里有了自己的offset，就会读不到之前producer发送到brok
kafka中的broker 是干什么的？ kafka 后端
2021-09-22 19:23

回答 1 已采纳你这是。。。自问自答？
关于flink接收kafka消息的代码能不能用python写 flink kafka python 有问必答
2021-08-16 15:59

回答 1 已采纳应该可以，不过通常使用scala语言进行编写
【Kafka】kafka方式消息不丢失的一些参数设置
2022-02-01 18:36

九师兄的博客 1、不要使用 producer.send(msg)，而要使用 producer.send(msg, ...如果设置成 all，则表明所有副本 Broker 都要接收到消息，该消息才算是“已提交”。这是最高等级的“已提交”定义。3、设置 retries 为一个较大的值。
kafka取不到监听数据 jar 有问必答
2021-04-20 10:49

回答 3 已采纳 https://gewu.pcwanli.com/front/article/10619.html
kafka消费者创建不了 java kafka linux
2022-08-23 10:01

回答 1 已采纳同一个消费组能同时消费的消费者数量和topic的分区数有关，估计是你的topic只有两个分区所以使用相同的groupid只有两个消费者在消费，加一个分区就好
Kafka bin目录下执行./kafka-console-producer.sh失败 java 有问必答
2021-03-29 16:19

回答 4 已采纳不是说文件权限，你是不是开启了 kafka 的认证，也就是说你要推送消息的话，需要认证。具体情况，你就要去百度看看怎么关闭了。
Kafka consumer 与 producer测试
2022-06-29 10:15

不懂开发的程序猿的博客通过完成本实验任务，要求学生熟练掌握Kafka consumer 与 producer的使用，为后续实验的开展奠定Kafka平台基础，也为从事大数据平台运维工程师、大数据技术支持工程师等岗位工作奠定夯实的技能基础。1、掌握Kafka ...
zookeeper 设置 Acl 后 kafka 启动失败 kafka zookeeper 分布式
2022-09-26 17:35

回答 1 已采纳网上都有相关文章，例如，你可以参考这篇：https://www.bilibili.com/read/cv11773508里面就有涉及到这两个的安全认证配置。
不使用zk实现双机clickhouse、kafka数据同步 kafka zookeeper
2023-02-02 16:54

回答 4 已采纳 ''该回答引用ChatGPT''如对你的问题有帮助，请点击右侧采纳即可！没有使用ZooKeeper的话，一种可行的方案是利用ClickHouse的复制功能实现双机数据同步。ClickHouse的复制功
Kafka消费者消费信息经常接收不到 java
2022-12-21 00:45

回答 1 已采纳这篇博客也许可以解决你的问题👉 ：kafka消费者从kafka读取信息
kafka怎么保证不丢失消息和不重复消费消息
2022-01-17 16:46

悬浮海的博客 Kafka中怎么保证消息不会丢失和不重复消费？从两个方面分析：消费推送和消息消费。也就是生产者和消费者两方面。首先我们需要知道topic的概念。 Topic ：话题，可以理解为一个队列，生产者和
编写一个生产者程序mysql_producer.py: json kafka
2022-05-22 16:56

回答 1 已采纳库没安装好吧第一句引入就报错了尝试卸载重装试下安装文档： Install — kafka-python 2.0.2-dev documentation
kafka如何保证消息不丢失和不重复消费
2024-06-24 10:38

sonOfSun@的博客消息不丢失：通过副本机制、生产者和 Broker 的配置来确保消息成功写入并持久。
kafka如何保证消息不丢失
2024-06-09 20:15

五敷有你的博客 Kafka发送消息是异步发送的，所以我们不知道消息是否发送成功，所以会可能造成消息丢失。而且Kafka架构是由生产者-服务器端-消费者三种组成部分构成的。要保证消息不丢失，那么主要有三种解决方法。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 9月10日

悬赏问题

¥15 35114 SVAC视频验签的问题
¥15 impedancepy
¥15 在虚拟机环境下完成以下，要求截图！
¥15 求往届大挑得奖作品（ppt…）
¥15 如何在vue.config.js中读取到public文件夹下window.APP_CONFIG.API_BASE_URL的值
¥50 浦育平台scratch图形化编程
¥20 求这个的原理图只要原理图
¥15 vue2项目中，如何配置环境，可以在打完包之后修改请求的服务器地址
¥20 微信的店铺小程序如何修改背景图
¥15 UE5.1局部变量对蓝图不可见

kafka consumer producer broker参数怎样设置才能确保消息不丢失不重复

1条回答 默认 最新

Producer 端参数设置：

Consumer 端参数设置：

问题事件

悬赏问题

1条回答默认最新