Kubernetes v1.36:云控制器管理器中的路由同步新指标

本文最初发布时日期有误。后来重新发布,日期为 2026 年 5 月 15 日。

Kubernetes v1.36 在位于 k8s.io/cloud-provider 的云控制器管理器(CCM)路由控制器实现中引入了一个新的 Alpha 计数器指标 route_controller_route_sync_total。此指标在每次与云提供商同步路由时递增。

基于监视的路由调谐的 A/B 测试

添加此指标是为了帮助运维人员验证在 Kubernetes v1.35 中引入的 CloudControllerManagerWatchBasedRoutesReconciliation 特性门控。 此特性门控将路由控制器从固定间隔循环切换为基于监视的方法,仅在节点实际发生变化时进行调谐。 这减少了对基础设施提供商的不必要 API 调用,降低了速率限制 API 的压力, 并允许运维人员更高效地使用其可用配额。

要对此进行 A/B 测试,请比较特性门控禁用(默认)与启用时的 route_controller_route_sync_total。 在节点变化不频繁的集群中,开启特性门控后,你应该会看到同步速率显著下降。

示例:预期行为

特性门控禁用时(默认的固定间隔循环),无论是否发生任何节点变化,计数器都会稳定递增:

# After 10 minutes with no node changes
route_controller_route_sync_total 60
# After 20 minutes, still no node changes
route_controller_route_sync_total 120

特性门控启用时(基于监视的调和),仅在节点实际被添加、移除或更新时,计数器才会递增:

# After 10 minutes with no node changes
route_controller_route_sync_total 1
# After 20 minutes, still no node changes — counter unchanged
route_controller_route_sync_total 1
# A new node joins the cluster — counter increments
route_controller_route_sync_total 2

这种差异在节点很少变化的稳定集群中尤其明显。

我在哪里可以提供反馈?

如果你有反馈,欢迎通过以下任一渠道联系我们:

我如何了解更多?

有关更多详细信息,请参阅 KEP-5237

最后修改 May 24, 2026 at 10:35 AM PST: [zh-cn]Add blog: ccm-metric-route-sync-total (56bf162f6c)