kafka分区策略疑惑

如果我在消息类producerRecord中定义了分区，或者设置了value，但我又配置了自定义的分区器，那此时会优先使用哪种分区策略呢？还有默认分区器会在什么时候用上呢，默认不是会粘性分区吗？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

AllenGd 领域专家: 大数据技术领域 2022-12-21 10:51

关注

消息经过序列化之后就需要确定它发往的分区，如果消息ProducerRecord中指定了partition字段，那么就不需要分区器的作用，因为partition代表的就是所要发往的分区号。如果消息ProducerRecord中没有指定partition字段，那么就需要依赖分区器，根据key这个字段来计算partition的值。分区器的作用就是为消息分配分区。
Kafka中提供的默认分区器是org.apache.kafka.clients.producer.internals.DefaultPartitioner, 它实现了org.apache.kafka.clients.producer.Partitioner接口。
除了使用Kafka提供的默认分区器进行分区分配，还可以使用自定义的分区器，只需同 DefaultPartitioner 一样实现Partitioner接口即可。默认分区器在 key为null 时不会选择非可用的分区，我们可以通过自定义的分区器打破这一限制。实现了自定义的分区器后需要通过配置参数 partition.class来显式指定这个分区器。示例如下：
properties.put(ProducerConfig.PARTITIONER_CLASS_CONFIG, DemoPartitioner.class.getName());

本回答被题主选为最佳回答 , 对您是否有帮助呢?

编辑记录

报告相同问题？

关注问题

Kafka核心技术与实战
2022-11-28 22:52

Kafka是由LinkedIn开发并贡献给Apache软件基金会的项目，它在大数据领域广泛应用，主要功能包括消息发布订阅、数据集成以及流处理。 Kafka的核心知识点主要包括以下几个方面： 1. **Kafka入门**：Kafka的基础概念...
Kafka原理+操作+实战
2022-07-14 00:01

大宁哥BigData的博客 kakfa原理，kafka机制，kafak使用，kafka api使用, Kafka原理+操作+实战+api
如何理解Kafka的消息可靠性策略？
2020-11-30 23:45

浪尖聊大数据-浪尖的博客导语 | Kafka作为一款性能优秀的消息队列，主要用于异步、削峰、解耦处理，在分布式事务中有着广泛的应用，但仍有很多开发者在运用过程中存在疑惑。文本将为大家由浅入深剖析Kafka基础原...
[面试题]Kafka
2024-06-20 11:19

it老鸟的呐喊的博客 Kafka 的应用场景 1）消息队列比起大多数的消息系统来说，Kafka 有更好的吞吐量，内置的分区，冗余及容错性，这让 Kafka 成为了一个很好的大规模消息处理应用的解决方案。消息系统一般吞吐量相对较低，但是需要更...
kafka实战篇（二）：消息消费实战
2020-04-24 16:00

且听_风吟的博客本文主要使用java来实战kafka消费数据的过程，解析并实现kafka手动提交offset和自动提交offset的demo，并进行详细的总结和对比。
运维人员如何利用Logi-KafkaManager了解、管控Kafka集群
2021-06-03 18:35

「已注销」的博客这个时候，我们还不是很了解Logi-KafkaManager究竟有哪些优点，还有如何去管理如此众多的kafka集群。那么今天这篇文章，就让我们来详细了解一下——运维人员是如何去了解和管控我们所有的集群的。 A.运维管控...
kafka python客户端连接风暴_【大数据实践】Kafka生产者编程（4）——ProducerConfig详解（上）...
2020-12-15 14:25

weixin_39724469的博客前言前面的文章对producer流程及其可自定义的配置类做了大体介绍，本文将继续对Kafka生成者编程相关知识点进行讲解。ProducerConfig类存放着producer客户端可配置的项以及其对应的解释文档，在本文中，主要根据其...
如何学习Linux：糙快猛的大数据之路（只讲大数据开发用到的）
2024-07-22 20:00

数据小羊的博客想要快速掌握Linux和大数据技能？本文介绍"糙快猛"学习法，助你从入门到精通！涵盖Linux基础、Shell脚本、系统优化到Hadoop、Spark等大数据技术。通过实际案例和高级故障排除指南，让你迅速应对工作挑战。还有性能...
2018 大数据面试
2018-10-02 16:01

Simple_Zz的博客 大数据工程师(开发)面试 1.HBase和Hive都是基于Hadoop，为什么Hive查询起来非常慢，但HBase不是？ Hive是类SQL引擎，其查询都需要遍历整张表，跑MapReduce自然很慢，但HBase是一种NoSQL的列式数据库，基于Key/...
是消息中间件，又不仅仅是消息中间件的kafka
2021-04-18 05:50

大将黄猿的博客什么是 Kafka kafka 最初是 LinkedIn 的一个内部基础设施系统。最初开发的起因是，LinkedIn 虽然有了数据库和其他系统可以用来存储数据，但是缺乏一个可以帮助处理持续数据流的组件。所以在设计理念上，开发者不想...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 1月9日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 1月1日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 12月20日

kafka分区策略疑惑

1条回答 默认 最新

问题事件

1条回答默认最新