微服务中的重试设计策略

需积分: 0 91 浏览量更新于2024-08-05 收藏 350KB PDF 举报

"这篇内容主要讨论了在IT领域中，特别是在分布式系统和网络通信中常见的重试设计策略。作者强调重试的目的是处理暂时性的故障，而非永久性问题，并介绍了几种适用的重试场景和避免的错误类型。文章提到了重试的策略，包括设置最大重试次数和采用指数级退避机制，以减轻网络负担并给予服务器更多恢复时间。" 在设计分布式系统或微服务架构时，重试设计是一个关键的弹力策略，因为它能帮助系统应对网络不稳定和临时故障。当服务间的通信从本地函数调用变为远程过程调用(RPC)时，网络组件的不稳定性可能导致各种问题，如DNS解析错误、网络延迟、路由器故障或负载均衡器的问题。在这种环境下，重试机制成为必不可少的容错手段。重试的适用场景主要包括调用超时和特定类型的错误响应，如服务繁忙、流量控制、维护状态或资源不足。然而，对于那些表明永久性错误或业务逻辑错误的情况（如权限问题、无效数据或技术错误，如HTTP 503服务不可用），重试通常不会解决问题，反而可能加剧问题，因此应避免不必要的重试。重试策略的核心之一是设置最大重试次数，以防止无限循环的重试导致系统资源耗尽。在每次重试失败后，通常会有一个短暂的等待时间，这个时间间隔随着重试次数的增加而呈指数级增长，这被称为指数级退避策略。此策略借鉴了TCP的拥塞控制思想，通过延长等待时间，减少短时间内对服务器的连续请求，从而降低网络拥塞的可能性，提高整体系统的稳定性和效率。例如，我们可以定义一个重试策略函数，该函数返回一个基于指数增长的等待时间，随着重试次数增加，等待时间翻倍。同时，我们可以定义一个枚举类型来表示不同的返回结果，如成功、维护中、繁忙、资源不足和服务器错误，便于根据不同的返回码决定是否进行重试。重试设计是构建健壮、高可用系统的关键部分，它需要综合考虑故障的临时性和网络环境的复杂性，以及如何平衡系统的恢复速度与资源利用率。通过合理的重试策略，系统能够更好地适应网络波动，提供更稳定的用户服务。

极客时间

http://139.196.35.134/time/#/article/4121[2018/8/1 10:19:55]

弹力设计篇之“重试设计”

2018-03-13 陈皓

关于重试，这个模式应该是一个很普遍的设计模式了。当我们把单体应用服务化，尤其是微服务化掉，本来在一个进程内的函数调用就成了远程调用，这样就会涉及到网络上的问

题。

网络上有很多的各式各样的组件，如：

DNS

服务，网卡、交换机、路由器、负载均衡等设备，这些设备都不一定是稳定的，在数据传输的整个过程中，只要一个环节出了问题，那么

都会导致问题。

重试的场景

所以，我们需要一个重试的机制。但是，我们需要明白的是，

重试

的语义是我们认为这个故障是暂时的，而不是永久的，所以，我们会去重试

。

所以，设计重试这个事时，我们需要定义出什么情况下需要重试，例如，调用超时、被调用端返回了某种可以重试的错误（如繁忙中、流控中、维护中、资源不足等）。

而对于一些别的错误，则最好不要重试，比如：业务级的错误（如没有权限、或是非法数据等错误），技术上的错误（如：

HTTP

的

503

等，这种原因可能是触发了代码的

bug

，重试

下去没有意义）。

重试的策略

关于重试的设计，一般来说，都需要有个重试的最大值，经过一段时间不断的重试后，就没有必要再重试了，应该报故障了。在重试过程中，每一次重试时不成功时都应该休息一会

儿再重试，这样可以避免因为重试过快而导致网络上的负担更重。

在重试的设计中，我们一般都会引入，



的策略，也就是所谓的

指数级退避

。在这种情况下，每一次重试所需要的休息时间都会翻倍增加。这种机制主要是用

来让被调用方能够有更多的时间来从容处理我们的请求。这其实和

TCP

的拥塞控制有点像。

如果我们写成代码应该是下面这个样子。

首先，我们定义一个调用返回的枚举类型，其中包括了

种返回错误

——

成功

SUCCESS

、维护中

NOT_READY

、流控中

TOO_BUSY

、没有资源

NO_RESOURCE

、系统错

误

SERVER_ERROR

。

public enum Results {

SUCCESS,

NOT_READY,

TOO_BUSY,

NO_RESOURCE,

SERVER_ERROR

}

接下来，我们定义一个



的函数，其返回

的指数。这样，每多一次重试就需要多等一段时间。如：第一次等

200ms

，第二次要

400ms

，第三次要等

800ms……







}

下面是真正的重试逻辑。我们可以看到，在成功的情况下，以及不属于我们定义的错误下，我们是不需要重试的，而两次重试间需要等的时间是以指数上升的。

弹力设计篇之

“

重试设计

”

陈皓

- 00:00 / 05:51

下载后可阅读完整内容，剩余5页未读，立即下载

艾斯·歪

粉丝: 42
资源: 342

微服务中的重试设计策略

分布式系统中的弹力设计与故障容忍

弹力笔筒设计装置行业文档概述

弹力设计总结：服务冗余与业务隔离关键技术

51弹力设计篇之“弹力设计总结”1

44弹力设计篇之“幂等性设计”1

62管理设计篇之-网关模式1

行业文档-设计装置-气弹簧式提拉门.zip

八年级物理下册第六章力和机械单元综合测试3新版粤教沪版

带弹力伸缩底板的书架设计与建筑装置应用

Ripr0-v5曰主题8.3开心版适用于知识付费资源素材博客

最新资源