分区从零开始分配RebalanceKafka(分区消费者分配主题订阅)「分区对kafka集群的好处说法错误的是」

#长文创作激励计划#大家好。

我是你们的小米,今天又来和大家分享一些Kafka的技术干货啦。

分区从零开始分配RebalanceKafka(分区消费者分配主题订阅)


我们今天的主题是Kafka的Rebalance(重平衡),这个过程对于维护Kafka集群的稳定性至关重要。
我们将会深入探讨以下几点:组成员数量发生变化订阅主题数量发生变化订阅主题的分区数发生变化并且我们会详细讲解Leader选举完成后的分配流程,以及分区分配算法RangeAssignor,最后我们还会介绍Kafka Topic的增删改查操作。
让我们开始吧。

Kafka Rebalance重平衡Kafka集群中的消费者组在以下几种情况下需要进行Rebalance:组成员数量发生变化:当消费者组中的成员增加或减少时,Kafka需要重新分配各个消费者的任务。
比如一个新的消费者加入组中,Kafka需要确保新的消费者能够获得其应有的分区,或者当一个消费者离开组时,Kafka需要将其负责的分区重新分配给其他消费者。
订阅主题数量发生变化:当消费者组订阅的主题数量发生变化时,也需要进行Rebalance。
例如,消费者组增加了对一个新主题的订阅,那么Kafka需要重新分配各个消费者的任务,确保新主题的分区被消费者组中的成员正确消费。
订阅主题的分区数发生变化:当订阅的主题增加或减少分区时,Kafka需要重新分配消费者的任务。
比如一个主题的分区数增加,那么Kafka需要确保这些新的分区被分配给消费者组中的成员进行消费。
Leader选举完成后的分配流程当以上三种情况发生时,Kafka会进行Leader选举,然后根据配置的RangeAssignor算法开始分配消费方案。
下面我们详细看看这个流程:Leader选举:当消费者组成员数量、订阅主题数量或分区数发生变化时,Kafka会首先进行Leader选举。
Leader会负责整个Rebalance过程。
分配消费方案:Leader选举完成后,Leader根据配置的RangeAssignor算法分配消费方案,决定哪个consumer负责消费哪些topic的哪些partition。
SyncGroup请求:Leader将分配好的消费方案封装进SyncGroup请求中发给coordinator。
非leader的consumer也会发送SyncGroup请求,但内容为空。
coordinator处理请求:coordinator接收到分配方案后,会将方案塞进SyncGroup的response中并发给各个consumer。
消费者接收分配方案:这样一来,组内的所有成员都知道自己应该消费哪些分区了。
分区分配算法RangeAssignorRangeAssignor是Kafka中默认的分区分配策略,它的原理非常简单明了:按照消费者总数和分区总数进行整除运算平均分配:RangeAssignor会先计算消费者的数量和分区的数量,然后进行整除运算,将分区平均分配给所有的消费者。
按照字典序排序:订阅同一个Topic的消费者会按照名称的字典序进行排序,然后进行分区的分配。
假设有3个消费者和10个分区,RangeAssignor会按照字典序分配,每个消费者先均分分区,剩下的分区则按照字典序从前往后分配。
Kafka Topic的增删改查操作我们在使用Kafka时,经常需要对Topic进行增删改查操作,以下是一些常用的命令:创建Topickafka-topics.sh --zookeeper localhost:2181/myKafka --create --topic topic_x --partitions 1 --replication-factor 1这个命令会在Kafka中创建一个名为topic_x的Topic,包含1个分区和1个副本。
删除Topickafka-topics.sh --zookeeper localhost:2181/myKafka --delete --topic topic_x这个命令会删除名为topic_x的Topic。
修改Topickafka-topics.sh --zookeeper localhost:2181/myKafka --alter --topic topic_x --config max.message.bytes=1048576这个命令会修改topic_x的配置,将max.message.bytes设置为1048576字节。
描述Topickafka-topics.sh --zookeeper localhost:2181/myKafka --describe --topic topic_x这个命令会显示topic_x的详细信息,包括分区数、副本因子、每个分区的副本和ISR等信息。
END今天的分享就到这里啦。

Kafka的Rebalance过程和分区分配算法是我们在日常使用中经常会遇到的知识点,掌握这些可以帮助我们更好地管理和维护Kafka集群。
希望大家通过这篇文章能对这些概念有更深入的了解。

如果大家还有什么问题或者感兴趣的话题,欢迎在评论区留言哦~我们下次再见。

我是小米,一个喜欢分享技术的29岁程序员。
如果你喜欢我的文章,欢迎关注我的微信公众号“软件求生”,获取更多技术干货。

联系我们

在线咨询:点击这里给我发消息