有关kafka消费者的问题，描述如下

现在有个问题请教下：有谁了解kafka，现在的问题就是我要读某个group中的固定个数分区的东西，然后consume这些数据的时候我要启用多线程读取，怎么保证我的数据不会重复（个人认为是不是偏移量就可以看出是否重复）,每个线程读到一堆数据后，然后解析成单个对象，再启动不同的线程入库，这种话多线程套多线程效率是不是会很低，多节点部署这个应用会平分这个执行效率，请问怎么解决这类问题

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
sxwws 2016-05-10 01:40
关注
你的这个结构首先要换一下。
如果你要去读取group中不同分区中的数据。对于你的consumer端来说，应该是1对1进行读取，也就是说，一个java进程对应一个分区partition。

你自己所想的，用一个java进程去监听多个分区，那你就应该让producer端将数据都放到一个partition中即可。这主要还是取决于你的消息数量和
你的处理速度。这个你应该是很好评估的。

至于你有没有处理重复的消息，这个你大可不必关心，这是消息中间件最基本的保证，kafka虽然事务性比较弱，如果你特别看重这点，你可以换
其他的消息中间件，也是可以的。比如activemq等。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Kafka 消费者位移（Offset）管理深入解析
2025-03-17 15:03

一碗黄焖鸡三碗米饭的博客 Kafka 消费者位移（Offset）管理是 Kafka 系统中至关重要的一部分，合理的位移管理不仅能够提高数据的消费效率，还能够保证数据的一致性和可靠性。本文详细探讨了消费者位移的存储、自动提交与手动提交的方式，分析...
Kafka 消费者专题
2025-01-05 14:36

无奈ieq的博客 pull模式不足之处是，如果kafka没有数据，消费者可能会陷入循环中，一直返回空数据。针对这一点，Kafka的消费者在消费数据时会传入一个时长参数timeout，如果当前没有数据可供消费，consumer会等待一段时间之后再...
图解Kafka | 彻底弄明白 Kafka消费者分区策略
2024-08-26 15:39

砖一块一块搬（同名知乎）的博客当启动一个Kafka消费者并订阅一个或多个主题时，Kafka消费者客户端会调用PartitionAssignor的subscription方法来创建订阅信息。然后，消费者组的leader（即组内的一个消费者）会接收到所有消费者的订阅信息，并通过 ...
Kafka - 3.x Kafka消费者不完全指北
2023-10-30 20:15

小小工匠的博客：初始化消费者组前，需要创建一个消费者配置对象，其中包括了一些重要的属性，例如Kafka集群的地址、消费者组的ID、自动提交偏移量等。：首先，你需要配置消费者的属性，包括Kafka集群的地址、消费者组、主题名称、...
深入解析 Kafka 消费者组与分区分配机制
2025-02-20 01:50

静默小音箱的博客 Kafka 的消费者组（Consumer Group）机制是其核心特性之一，它允许多个消费者实例协同工作，共同处理一个主题（Topic）的消息。本文将通过实例详细解析 Kafka 的消费者组如何与主题分区（Partition）进行分配，以及...
【Kafka】Kafka消费者
2023-07-10 00:20

嗯mua.的博客例如：groupid的hashcode值=1，1%50=1，那么_consumer_offsets主题的1号分区，在哪个broker上，就选择这个节点的coordinator作为这个消费者组的老大。**注意：在消费者API代码中必须配置消费者组id。**命令行启动...
Kafka之消费者客户端
2024-10-22 21:58

cab5的博客对Kafka消费者客户端相关的知识进行介绍
kafka消费者执行异常重复消费_Kafka消费者的使用和原理
2021-02-03 04:04

易北河雄鹰的博客这周我们学习下消费者，仍然还是先从一个消费者的Hello World学起：publicclassConsumer{publicstaticvoidmain(String[]args){//1.配置参数Propertiesproperties=newProperties();properties.put("key.d...
Kafka重平衡导致无限循环消费问题
2024-05-27 18:28

弦上的梦的博客通过消费组管理消费者时，该配置指定拉取消息线程最长空闲时间，若...Kafka消费者消费消息超过了5分钟，不停的触发重平衡，消费者的offset因为重平衡提交失败，重复拉取消费，重复消费。5. 订阅主题的分区数发生变更。
【技海登峰】Kafka漫谈系列（十一）SpringBoot整合Kafka之消费者Consumer
2025-05-18 20:58

阿阿阿安的博客 Spring for Apache Kafka(spring-kafka)项目对原生Java客户端进行了基于Spring特性的抽象与封装，本文详细介绍了SpringBoot整合Kafka中的生产者Consumer相关内容，包括@KafkaListener注解、消息的多种消费方式、反...
没有解决我的问题, 去提问

有关kafka消费者的问题，描述如下

1条回答 默认 最新

1条回答默认最新