宣布成立 AI 网关工作组
Kubernetes 社区包含多个特别兴趣小组(SIG)和工作组(WG), 旨在促进相关贡献者之间就重要议题展开讨论。 今天,我们很高兴地宣布成立 AI 网关工作组, 这是一项专注于为 Kubernetes 环境中支持 AI 工作负载的网络基础设施制定标准和最佳实践的新举措。
什么是 AI 网关?
在 Kubernetes 环境中,AI 网关指的是网络网关基础设施(包括代理服务器、负载均衡器等), 它通常实现 Gateway API 规范,并针对 AI 工作负载提供增强功能。 AI 网关并非定义一个独立的产品类别,而是描述旨在对 AI 流量实施策略的基础设施,包括:
- 基于 token 的 AI API 速率限制。
- 推理 API 的细粒度访问控制。
- 有效负载检查,实现智能路由、缓存和防护机制。
- 支持 AI 特有的协议和路由模式。
工作组章程和使命
AI 网关工作组遵循清晰的章程运作, 其使命是为 Kubernetes 特别兴趣小组(SIG)及其子项目制定提案。 其主要目标包括:
- 标准制定:为 Kubernetes 中的 AI 工作负载网络创建声明式 API、标准和指南。
- 社区协作:促进讨论并就 AI 基础设施的最佳实践达成共识。
- 可扩展架构:确保 AI 专用网关扩展的可组合性、可插拔性和有序处理。
- 基于标准的方法:基于已建立的网络基础,在成熟的标准之上构建 AI 专用功能。
活跃提案
AI 网关工作组目前有多个活跃提案, 旨在解决 AI 工作负载网络领域的关键挑战:
有效载荷处理
有效载荷处理提案 旨在满足 AI 工作负载检查和转换完整 HTTP 请求和响应有效载荷的关键需求。
这可以实现:
AI 推理安全
- 防御恶意提示和提示注入攻击。
- 对 AI 响应进行内容过滤。
- 对 AI 流量进行基于特征的检测和异常检测。
AI 推理优化
- 基于请求内容的语义路由。
- 智能缓存,以降低推理成本并缩短响应时间。
- 集成 RAG 系统,以增强上下文信息。
该提案定义了声明式有效载荷处理器配置、有序处理流水线和可配置故障模式的标准 —— 所有这些对于生产级 AI 工作负载部署都至关重要。
出口网关
现代 AI 应用越来越依赖外部推理服务,无论是用于构建专用模型、实现故障转移,还是优化成本。
出口网关提案 旨在定义将流量安全地路由到集群外部的标准。 主要特性包括:
外部 AI 服务集成
- 安全访问云端 AI 服务(OpenAI、Vertex AI、Bedrock 等)。
- 为第三方 AI API 提供托管身份验证和令牌注入。
- 具备区域合规性和故障转移功能。
高级流量管理
- 为外部 FQDN 和服务定义后端资源。
- TLS 策略管理和证书颁发机构控制。
- 为集中式 AI 基础设施提供跨集群路由。
我们正在解决的用户场景
- 提供外部 AI 服务托管访问的平台运营商。
- 需要跨多个云提供商进行推理故障转移的开发人员。
- 执行 AI 流量区域限制的合规工程师。
- 将 AI 工作负载集中部署在专用集群上的组织。
即将举行的活动
KubeCon + CloudNativeCon Europe 2026,阿姆斯特丹
AI 网关工作组成员将在阿姆斯特丹举行的 KubeCon + CloudNativeCon Europe 上发表演讲,探讨人工智能与网络交叉领域的问题,包括工作组正在推进的提案,以及 AI 网关与模型上下文协议(MCP)和代理网络模式的交叉应用。 本次会议将展示 AI 网关工作组的提案如何为下一代 AI 部署和通信模式构建所需的基础设施。 会议还将介绍工作组路线图的初始设计、早期原型和新兴方向。 更多详情,请点击此处查看我们的会议:
参与其中
AI 网关工作组代表 Kubernetes 社区致力于 AI 工作负载网络标准化。随着 AI 日益融入现代应用,我们需要强大且标准化的基础设施,以满足推理工作负载的独特需求, 同时保持 Kubernetes 用户所期望的安全性、可观测性和可靠性标准。
我们的提案目前正在积极开发中,并已开始在各个网关项目中实施。 我们正与 SIG Network 紧密合作,增强网关 API,并与更广泛的云原生社区协作, 以确保我们的标准能够满足实际生产需求。
无论您是网关实现者、平台运维人员、AI 应用开发者,还是仅仅对 Kubernetes 和 AI 的交叉领域感兴趣,我们都欢迎您的参与。 工作组采用开放贡献模式——您可以查看我们的提案、参加每周例会,或在我们的 GitHub 代码库上发起讨论。
了解更多信息:
- 访问工作组的 GitHub 代码库。
- 阅读工作组的章程。
- 参加每周四下午 2 点(美国东部时间)的每周例会。
- 加入工作组的 Slack 频道(#wg-ai-gateway)(访问 https://slack.k8s.io/ 获取邀请)。
- 加入 AI Gateway 邮件列表(https://groups.google.com/a/kubernetes.io/g/wg-ai-gateway)。
Kubernetes 中 AI 基础设施的未来正在构建中,加入我们,了解如何贡献力量,帮助塑造 Kubernetes 中 AI 感知网关功能的未来。