可配置的卫生检查Kubernetes基础设施节点

海洋的地方使serverless容器基础设施体验。今天,我们很高兴提供一个可配置的健康检查期限自动伸缩功能节点为了增加海洋的灵活性以满足客户的所有需求。

集装箱的应用程序运行时,每个组织都有自己的独特的依赖性。无论是升级节点AMI (Amazon Machine Image)或Kubelet更新,安装可观测性代理(例如Datadog, NewRelic),或运行机器学习通过使用自定义包像Nvidia GPU图书馆工作负载,满足依赖关系确保节点是健康的。基础设施的启动时间节点不同由于这些依赖项,一个可配置的健康检查确保节点准备为调度Kubernetes豆荚和健康。

此前,海洋固定健康检查周期为300秒,在其中一个节点必须声明自己是健康的。我们已经启用能力配置一个宽限期为每个节点自动缩放海洋。这将确保没有假阳性节点标记为替代,他们只是把(相对)不再成为健康。

通过节点配置健康检查卫生的宽限期是可以通过控制台,在编辑集群:

可配置的健康检查Kubernetes和ECS

通过API:

“策略”:{“fallbackToOd”:真的,“utilizeReservedInstances”:真的,“drainingTimeout”: 60岁的“gracePeriod”: 600},

并通过起程拓殖:

/ / - - -战略- - - - - - - - - - - - - - - - - - - - - - fallback_to_ondemand = true draining_timeout = 120 utilize_reserved_instances = false grace_period = 600 / / - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

Baidu
map