kafka Consumer消费数据手动commit问题

Consumer设置成手动提交enable.auto.commit=false，但是在处理完消息过后没有进行consumer.commitAsync()。按照我的理解此时消费的offset是没有更新的，如果第一次producer发了五条信息，Consumer处理了这五条信息，第二次Producer又发五条信息，此时Consumer poll数据的时候应该是第一次和第二次相加的10条数据（因为消费的offset没有更新，Consumer应该从第一次发送的数据进行poll），但是我测试的结果是还是五条（Consumer没有重启，一直启动的，producer发多少条消息，Consumer就消费多少条消息）。
我的疑问就是，既然没有commit最新的 offset，那么为什么producer发送新发送的消息，Consumer就能接收到，而不是从原来的offset poll数据。但是，如果重启一下Consumer，poll的数据就是10条。再重启也是最新的没有更新offset的那10条数据。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

5条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
木号 2019-05-03 14:31
关注
因为kafka的offset下标的记录实际会有两份，服务端会自己记录一份，本地的消费者客户端也会记录一份，所以Consumer接收并打印出来的消息是：1、2、3、4、5、6、7、8、9、10。如果两次拉取之间有个重启，consumer本地的记录就会消失。得到的信息就是 1、2、3、4、5、1、2、3、4、5、6、7、8、9、10。
这时，如果有多个线程的话，每一个线程都会消费重复全部的消息。就好像只有一个线程一样。

解决 4
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

kafka拉取不到数据 java kafka 分布式有问必答
2022-02-16 19:32

回答 4 已采纳重新开一个topic，然后先启动consumer，再启动producer，再发消息，你这个可能是consumer已经在broker里有了自己的offset，就会读不到之前producer发送到brok
kafka可以生产无法消费的问题 java kafka
2022-06-11 10:41

回答 1 已采纳给你个例子，是可以收发的。验证通过再和你的对比一下，你应该哪里配错了。 springboot集成kafka、消息发送、消费使用_‘’小磊的博客-CSDN博客_spri
flink消费kafka数据延迟 flink postgresql scala 有问必答
2022-01-28 09:47

回答 1 已采纳那最后写入到库了吗，如果写不进去，上游kafka肯定会延迟越来越大的，可以在sink里多打印下错误，或者设置写入超时时间，问题应该在写入
Kafka：消费者手动提交
2023-03-21 21:56

程序员无羡的博客 Kafka：设置消费者手动提交offset
Kakfa的数据稳定消费问题 kafka 大数据
2023-01-14 04:00

回答 1 已采纳你要记录你的消费的offset从指定offset开始消费。如果有过消费记录的话。如果不指定就从eariest开始消费
Springboot集成kafka，应用很卡，消费很慢 java kafka spring boot
2022-10-25 09:26

回答 5 已采纳感觉消息堆积有点厉害，查一下代码，是因为什么原因导致消息一直没被消费。如果只是前端数据，可以丢弃的话，把队列清空，看看还会不会卡？
kafka消费者创建不了 java kafka linux
2022-08-23 10:01

回答 1 已采纳同一个消费组能同时消费的消费者数量和topic的分区数有关，估计是你的topic只有两个分区所以使用相同的groupid只有两个消费者在消费，加一个分区就好
Kafka数据消费：快速上手
2022-02-18 18:53

O_1CxH的博客 Kafka数据消费：快速上手介绍Kafka的运作流程，并使用python代码的示例完成Kafka数据消费
kafka取不到监听数据 jar 有问必答
2021-04-20 10:49

回答 3 已采纳 https://gewu.pcwanli.com/front/article/10619.html
flinksql读取kafka数据报错 flink kafka
2022-07-13 20:33

回答 3 已采纳 restclient异常，先看看taskmanager和jobmanager是否正常，然后你可以在jobmanager的节点上访问webUI查看job状态，又或者直接查看宿主机上的日志排查问题
kafka实时传输数据，保证实时性 java kafka 有问必答
2021-07-22 08:54

回答 4 已采纳用@Scheduledhttps://blog.csdn.net/limingcai168/article/details/103394041
Kafka Consumer Rebalance详解
2022-11-14 11:48

王知无(import_bigdata)的博客全网最全大数据面试提升手册！文章目录Kafka版本rebalancerebalance策略rebalance generationrebalance协议rebalance流程rebalance监听器1....2. rebalanceConsumerGroup(消费组)里的Consumer(消费者)共同读取t...
从kafka里面消费数据，就是连接不到kafka，在kafka里面生成和消费都没有问题，也没有报错，求大神指教哪里有问题，我也从来没遇到过这个问题，求指教？ scala
2020-06-03 19:17

回答 1 已采纳 https://blog.csdn.net/a1165117473/article/details/83791106
大数据技术之Kafka——Kafka入门
2023-04-20 23:11

five小点心的博客传统定义：Kafka是一个分布式的基于发布/订阅模式的消息队列（Message Queue）主要应用于大数据实时处理领域。发布/订阅：消息的发布者不会将消息直接发送给特点的订阅者，而是将发布的消息分为不同的类别，订阅者只...
Kafka Consumer
2020-06-14 15:51

orange大数据技术探索者的博客 Consumer消费数据时的可靠性是很容易保证的，因为数据在Kafka中是持久化的，故不用担心数据丢失问题。由于consumer在消费过程中可能会出现断电宕机等故障，consumer恢复后，需要从故障前的位置的继续消费，所以...
没有解决我的问题, 去提问

悬赏问题

¥15 c程序不知道为什么得不到结果
¥40 复杂的限制性的商函数处理
¥15 程序不包含适用于入口点的静态Main方法
¥15 素材场景中光线烘焙后灯光失效
¥15 请教一下各位，为什么我这个没有实现模拟点击
¥15 执行 virtuoso 命令后，界面没有，cadence 启动不起来
¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
¥20 有关区间dp的问题求解
¥15 多电路系统共用电源的串扰问题
¥15 slam rangenet++配置

kafka Consumer消费数据手动commit问题

5条回答 默认 最新

悬赏问题

5条回答默认最新