详细介绍
Knative Serving 是一个构建在 Kubernetes 之上的 serverless 容器运行时,提供请求驱动的执行模型、自动扩缩(包括 scale-to-zero)、路由与流量管理等核心能力。它将应用以修订(revision)为单位管理,支持零停机部署、自动回滚与基于配置的持续更新,便于在云原生环境中以最小运维成本提供弹性服务。
主要特性
- 支持 scale-to-zero 与自动弹性扩缩,按需收起空闲实例以降低资源成本。
- 提供请求驱动的流量路由、版本灰度与流量拆分能力,支持零停机发布。
- 与 Kubernetes 原生生态集成,可使用多种网络层实现(Istio, Contour 等)。
使用场景
适用于需要快速发布、弹性伸缩与按需计费的服务场景,如事件驱动微服务、短时任务处理、HTTP/gRPC 推理服务以及需要频繁发布与灰度的在线服务。对于 ML/AI 场景,它可作为模型推理容器的弹性托管层,按请求自动扩缩,配合 autoscaler 保障延迟与成本平衡。
技术特点
项目以 Go 语言实现,关注高可用、可观测与与 Kubernetes 的深度集成。架构上包含 Activator、Autoscaler、Queue-Proxy 等组件,负责请求排队、并发控制与实例生命周期管理,支持多种网络插件与扩展点,便于在不同集群环境中部署与运维。