KubeRay¶
KubeRay 提供了一种在 Ray 集群上以 Kubernetes 原生方式运行 vLLM 工作负载的方法。 Ray 集群可以通过 YAML 声明,然后由 operator 处理 Pod 调度、网络配置、重启和蓝绿部署 —— 同时保留熟悉的 Kubernetes 体验。
为什么选择 KubeRay 而不是手动脚本?¶
| 特性 | 手动脚本 | KubeRay |
|---|---|---|
| 集群引导 | 手动 SSH 到每个节点并运行脚本 | 一条命令即可创建或更新整个集群:kubectl apply -f cluster.yaml |
| 自动扩缩容 | 手动操作 | 自动修补 CRD 以调整集群大小 |
| 升级 | 手动拆除并重新创建 | 支持蓝/绿部署更新 |
| 声明式配置 | Bash 标志和环境变量 | 适合 GitOps 的 YAML CRD(RayCluster/RayService) |
使用 KubeRay 可降低运维负担,并简化 Ray + vLLM 与现有 Kubernetes 工作流(CI/CD、密钥、存储类等)的集成。
了解更多¶
- "在 Kubernetes 上使用 Ray Serve LLM 提供大型语言模型服务" - 一个关于如何使用 vLLM、KubeRay 和 Ray Serve 提供模型服务的端到端示例。
- KubeRay 文档