【Java面试】什么是 ISR，为什么需要引入 ISR（）

　　本篇文章为你整理了【Java面试】什么是 ISR，为什么需要引入 ISR（）的详细内容，包含有为什么要建立isms 【Java面试】什么是 ISR，为什么需要引入 ISR，希望能帮助你了解【Java面试】什么是 ISR，为什么需要引入 ISR。

　　好的，关于这个问题，我需要从几个方面来回答。

　　首先，发送到Kafka Broker上的消息，最终是以Partition的物理形态来存储到磁盘上的。

　　而Kafka为了保证Parititon的可靠性，提供了Paritition的副本机制，然后在这些Partition副本集里面。

　　存在Leader Partition和Flollower Partition。

　　生产者发送过来的消息，会先存到Leader Partition里面，然后再把消息复制到Follower Partition，

　　这样设计的好处就是一旦Leader Partition所在的节点挂了，可以重新从剩余的Partition副本里面选举出新的Leader。

　　然后消费者可以继续从新的Leader Partition里面获取未消费的数据。

　　在Partition多副本设计的方案里面，有两个很关键的需求。

　　副本数据的同步

　　新Leader的选举

　　这两个需求都需要涉及到网络通信，Kafka为了避免网络通信延迟带来的性能问题，

　　以及尽可能的保证新选举出来的Leader Partition里面的数据是最新的，所以设计了ISR这样一个方案。

　　ISR全称是 in-sync replica，它是一个集合列表，里面保存的是和Leader Parition节点数据最接近的Follower Partition

　　如果某个Follower Partition里面的数据落后Leader太多，就会被剔除ISR列表。

　　简单来说，ISR列表里面的节点，同步的数据一定是最新的，所以后续的Leader选举，只需要从ISR列表里面筛选就行了。

　　所以，我认为引入ISR这个方案的原因有两个

　　尽可能的保证数据同步的效率，因为同步效率不高的节点都会被踢出ISR列表。

　　避免数据的丢失，因为ISR里面的节点数据是和Leader副本最接近的。

　　以上就是我对这个问题的理解。

　　在我看来，这个问题非常有研究价值。

　　一般来说，副本数据同步，无非就是同步阻塞、或者异步非阻塞。

　　但是这两种方案，要么带来性能问题，要么带来数据丢失问题，都不是特别合适。

　　而ISR，就非常完美解决了这个问题，在实际过程中，我们也可以借鉴类似的设计思路。

　　喜欢我作品的小伙伴，记得点赞收藏加关注。

　　如果本篇文章对您有帮助，还请帮忙点个关注和赞，您的坚持是我不断创作的动力。欢迎关注「跟着Mic学架构」公众号公众号获取更多技术干货！

　　以上就是【Java面试】什么是 ISR，为什么需要引入 ISR（）的详细内容，想要了解更多【Java面试】什么是 ISR，为什么需要引入 ISR的内容，请持续关注盛行IT软件开发工作室。

郑重声明：本文由网友发布，不代表盛行IT的观点，版权归原作者所有，仅为传播更多信息之目的，如有侵权请联系，我们将第一时间修改或删除，多谢。