Kubernetes：优化宕机Pod自动迁移的策略

需积分: 0 196 浏览量更新于2024-08-03 收藏 105KB PDF 举报

"k8s宕机pod自动迁移方案" 在Kubernetes集群中，当节点遇到问题或宕机时，为了确保服务的高可用性，Kubernetes设计了一套机制来自动处理这种情况，即Pod的自动迁移。这个过程涉及到节点条件(Conditions)、污点(Taints)和容忍度(Tolerations)的管理，以及控制器Manager的相关参数设置。 1. **节点条件与污点机制** 当Kubernetes节点进入异常状态，例如NotReady，系统会检查节点的条件并设置相应的状态。如果节点持续异常，Kubernetes会为该节点添加一个污点(Taint)，这个污点会触发Pod的驱逐。同时，Pod在创建时可以通过设置`tolerationSeconds`参数来定义它能够容忍节点处于NotReady状态的最长时间。 2. **Pod容忍节点异常时间** 默认情况下，Kubernetes会等待40秒来判断节点是否不健康，然后Pod会容忍节点NotReady状态长达5分钟。这意味着在节点真正被认为不可用并开始驱逐Pod之前，总共有340秒的延迟。 3. **调整节点被标记为不健康的时间** 这个时间由`--node-monitor-grace-period`参数控制，它定义了ControllerManager在标记节点为不健康前允许其无响应的时长。默认值是40秒，但需要比Kubelet的`nodeStatusUpdateFrequency`参数（节点状态更新频率）大N倍，N为Kubelet重试发送节点状态的次数。如果要修改此参数，需要在每个Master节点上的ControllerManager配置文件中添加或更新该参数。 4. **实际操作步骤** 要调整`--node-monitor-grace-period`，你需要在每台Master节点的`/etc/kubernetes/controller-manager`配置文件中进行编辑，增加或修改参数。同时，需要注意保持该值与`nodeStatusUpdateFrequency`和重试次数之间的适当关系。 5. **Pod调度策略** 对于关键业务，可能需要减少Pod对节点异常的容忍时间，以尽快在其他健康节点上重建Pod。这可以通过修改Pod的YAML定义，减少`tolerationSeconds`参数的值来实现。 6. **Kubernetes的容错能力** Kubernetes的容错设计是基于冗余和自我修复的，通过Pod的自动迁移，可以确保服务在节点故障时仍能继续运行。理解并正确配置这些机制对于构建健壮的云原生应用至关重要。 Kubernetes的节点监控、污点和容忍度机制提供了对节点异常的智能响应，允许管理员通过调整参数来优化Pod的迁移策略，从而提高服务的稳定性和恢复速度。在实际操作中，应根据业务需求和集群规模来定制这些参数，以实现最佳的故障恢复效果。

Pod 容忍节点异常时间调整容忍节点异常时间调整

1. 原理说明原理说明

Kubernetes 集群节点处于异常状态之后需要有⼀个等待时间，才会对节点上的 Pod 进⾏驱逐。那么针对部分关键业务，是否可以调整这个时间，便于在节点发⽣异常时及时将 Pod 驱逐

并在别的健康节点上重建？

要解决这个问题，我们⾸先要了解 Kubernetes 在节点异常时驱逐 Pod 的机制。

在 Kubernetes 1.13 及以后的版本中默认开启了 TaintBasedEvictions 及 TaintNodesByCondition 这两个 feature gate，节点及其上 Pod 的⽣命周期管理将通过节点的

Condition 和 Taint 来进⾏，Kubernetes 会不断地检查所有节点状态，设置对应的 Condition，根据 Condition 为节点设置对应的 Taint，再根据 Taint 来驱逐节点上的 Pod。

同时在创建 Pod 时会默认为 Pod 添加相应的 tolerationSeconds 参数，指定当节点出现异常（如 NotReady）时 Pod 还将在这个节点上运⾏多⻓的时间。

那么，节点发⽣异常到 Pod 被驱逐的时间，就取决于两个参数：1. 节点实际异常到被判断为不健康的时间；2. Pod 对节点不健康的容忍时间。

Kubernetes 集群中默认节点实际异常到被判断为不健康的时间为 40s，Pod 对节点 NotReady 的容忍时间为 5min，也就是说，节点实际异常 5min40s（340s）后，节点上的 Pod 才会

发⽣驱逐。

2. 调整节点被标记为不健康的时间调整节点被标记为不健康的时间

ControllerManager 参数 --node-monitor-grace-period 控制了在将⼀个节点标记为不健康之前允许其⽆响应的时⻓上限，该参数默认值为 40s，且必须⽐ Kubelet 的

nodeStatusUpdateFrequency 参数（Kubelet 向主控节点汇报节点状态的时间间隔）⼤ N 倍；这⾥ N 指的是 kubelet 发送节点状态的重试次数。

Pod 容忍节点异常时间调整

下载后可阅读完整内容，剩余3页未读，立即下载

linuxit

粉丝: 0
资源: 1

Kubernetes：优化宕机Pod自动迁移的策略

K8S容器版跳板机k8s-jumpserver：POD自注册简化开发调试

K8S技术深度探讨：Pod详解与管理策略

Skyline-COC升级脚本：K8s环境下的系统迁移

k8s中node节点宕机后pod怎么迁移

k8s入门介绍，k8s多master多noede安装部署教程

K8S 中配置与管理容器的存储卷

Kubernetes_K8s 中的故障排查与故障恢复

使用kubeadm搭建生产环境的单master节点k8s集群-详细搭建指南

Kubernetes中Pod的调度和自动修复策略

Docker容器编排实战：Ubuntu上的自动化部署流程详解

最新资源