本文回顾了 Istio 开源近五年来的发展,并展望了 Istio 服务网格的未来方向。本文的主要观点如下:
2013 年起,随着移动互联网的爆发,企业对应用迭代的效率要求更高,应用程序架构开始从单体转向微服务,DevOps 也开始变得流行。同年随着 Docker 的开源,解决了应用封装和隔离的问题,使得应用在编排系统中调度变得更容易。2014 年 Kubernetes、Spring Boot 开源,Spring 框架开发微服务应用开始流行,在接下来的几年间大批的 RPC 中间件开源项目出现,如 Google 在 2016 年发布 gRPC 1.0,蚂蚁在 2018 年开源 SOFAStack 等,微服务框架百花齐放。为了节约成本,增加开发效率,使应用更具弹性,越来越多的企业正在迁移上云,但这不仅仅是将应用搬到云上那么简单,为了更高效地利用云计算,一套「云原生」方法和理念也呼之欲出。
Istio 开源发展时间线如下图所示。
下面我们来简单回顾下 Istio 开源大事件:
微服务和容器化之后,异构语言使用的增加,服务的数量激增,容器的生命周期变短是导致服务网格出现的根本原因。
我们先来看下服务从部署在 Kubernetes 到 Istio 中架构的变迁,然后再探讨架构演进过程中 Istio 的需求,下文假定读者已了解 Kubernetes 和 Istio 的架构。
从 Kubernetes 到 Istio,概括的讲应用的部署架构有如下特点:
Kubernetes 管理应用的生命周期,具体来说,就是应用的部署和管理(扩缩容、自动恢复、发布策略);
基于 Kubernetes 的自动 sidecar 注入,实现了透明流量拦截。先通过 sidecar 代理拦截到微服务间流量,再通过控制平面配置管理微服务的行为。如今服务网格的部署模式也迎来了新的挑战,sidecar 已经不是 Istio 服务网格所必须的,基于 gRPC 的无代理的服务网格 5 也在测试中。
服务网格将流量管理从 Kubernetes 中解耦,服务网格内部的流量无须 kube-proxy
组件的支持,通过类似于微服务应用层的抽象,管理服务间的流量,实现安全性和可观测性功能。
Kubernetes 集群外部的客户端访问集群内部服务时,原先是通过 Kubernetes Ingress,在有了 Istio 之后,会通过 Gateway 来访问 6。
Kubernetes 容器编排与可编程代理 Envoy 为 Istio 的出现打下了坚实的基础。
从上面 Kubernetes 到 Istio 的架构的转变的描述中,我们可以看到为了让开发者最小成本地管理服务间的流量,Istio 需要解决三个问题:
以上三个条件对于 Istio 服务网格来说缺一不可,而且,从中我们可以看到,这些要求基本都是对于 sidecar 代理的要求,这个代理的选择将直接影响该项目的走向与成败。为了解决以上三个问题,Istio 选择了 Kubernetes 容器编排和可编程代理 Envoy。
如果你使用的是如 gRPC 这类中间件开发微服务,在程序中集成 SDK 后,SDK 中的拦截器会自动为你拦截流量,如下图所示。
如何让 Kubernetes pod 中的流量都通过代理呢?答案是在每个应用程序 pod 中注入一个代理,与应用共享网络空间,再通过修改 pod 内的流量路径,让所有进出 pod 的流量都经过 sidecar,其架构如下图所示。
从图中我们可以看到其中有一套非常复杂的 iptables 流量劫持逻辑(详见 Istio 中的 Sidecar 注入、透明流量劫持及流量路由过程详解),使用 iptables 的好处是适用于任何 Linux 操作系统。但是这也带来了一些副作用:
针对这两个问题,如何优化服务网格呢?
本文将在后面性能优化一节讲解这些细节。
Istio 是在 Kubernetes 的基础上构建的,它可以利用 Kubernetes 的容器编排和生命周期管理,在 Kubernetes 创建 pod 时,通过准入控制器自动向 pod 中注入 sidecar。
为了解决 Sidecar 的资源消耗问题,有人为服务网格提出了有四种部署模式,如下图所示。
下表中详细对比了这四种部署方式,它们各有优劣,具体选择哪种根据实际情况而定。
模式 | 内存开销 | 安全性 | 故障域 | 运维 |
---|---|---|---|---|
Sidecar 代理 | 因为为每个 pod 都注入一个代理,所以开销最大。 | 由于 sidecar 必须与工作负载一起部署,工作负载有可能绕过 sidecar。 | Pod 级别隔离,如果有代理出现故障,只影响到 Pod 中的工作负载。 | 可以单独升级某个工作负载的 sidecar 而不影响其他工作负载。 |
节点共享代理 | 每个节点上只有一个代理,为该节点上的所有工作负载所共享,开销小。 | 对加密内容和私钥的管理存在安全隐患。 | 节点级别隔离,如果共享代理升级时出现版本冲突、配置冲突或扩展不兼容等问题,则可能会影响该节点上的所有工作负载。 | 不需要考虑注入 Sidecar 的问题。 |
Service Account / 节点共享代理 | 服务账户 / 身份下的所有工作负载都使用共享代理,开销小。 | 工作负载和代理之间的连接的认证及安全性无法保障。 | 节点和服务账号之间级别隔离,故障同“节点共享代理”。 | 同“节点共享代理”。 |
带有微代理的共享远程代理 | 因为为每个 pod 都注入一个微代理,开销比较大。 | 微代理专门处理 mTLS,不负责 L7 路由,可以保障安全性。 | 当需要应用 7 层策略时,工作负载实例的流量会被重定向到 L7 代理上,若不需要,则可以直接绕过。该 L7 代理可以采用共享节点代理、每个服务账户代理,或者远程代理的方式运行。 | 同“Sidecar 代理”。 |
Flomesh 的张晓辉曾在 为什么需要可编程代理 博客中详细说明了代理软件的发展演化过程,我下面将引用他的一些观点,说明可编程代理 Envoy 在 Istio 中的关键作用。
下图展示了代理从配置到可编程模式的演化过程,及每个阶段中的代表性代理软件。
整个代理演化过程都是随着应用从本地和单体,越来越走向大规模和分布式。下面我将简要概括代理软件的发展过程:
现在我将列举一些流行的服务网格开源项目,让我们一起探索服务网格的发展规律和本质。下表对比了当前流行的服务网格开源项目 7。
对比项 | Istio | Linkerd | Consul Connect | Traefik Mesh | Kuma | Open Service Mesh (OSM) |
---|---|---|---|---|---|---|
当前版本 | 1.14 | 2.11 | 1.12 | 1.4 | 1.5 | 1.0 |
许可证 | Apache License 2.0 | Apache License 2.0 | Mozilla License | Apache License 2.0 | Apache License 2.0 | Apache License 2.0 |
发起者 | Google、IBM、Lyft | Buoyant | HashiCorp | Traefik Labs | Kong | Microsoft |
服务代理 | Envoy,支持 gRPC 的 proxyless 模式 | Linkerd2-proxy | 默认为 Envoy,可替换 | Traefik Proxy | Envoy | Envoy |
入口控制器 | Envoy,自定义的 Ingress,支持 Kubernetes Gateway API | 无内置 | Envoy,支持 Kubernetes Gateway API | 无内置 | Kong | 支持 Contour、Nginx,兼容其他 |
治理 | Istio Community 和 Open Usage Commons,已提议捐献给 CNCF | CNCF | 查看 贡献指南 | 查看 贡献指南 | CNCF | CNCF |
上表中列出的都是服务网格,下面再简单评论一下这些项目:
另外还有几个项目,也服务网格领域也经常被提及,但它们都不是服务网格:
纵观以上项目,我们可以看出大部分服务网格项目的发起者都是根据代理起家,然后做控制平面。而且 Istio、Consul Connect、Open Service Mesh、Kuma 都是使用 Envoy 作为 sidecar 代理。只有 Linkerd 和 Traefik Mesh 推出了自己的代理。而所有的服务网格项目都支持 sidecar 模式。除了 Istio、Linkerd、Consul Connect 已应用于生产上,其他服务网格项目还没有看到被大规模在生产上使用。
在 Istio 1.5 版本确定了稳定的架构之后,社区的主要精力在于优化 Istio 的性能。下面我将向你详细介绍 Istio 中的性能优化方法,包括:
Proxyless 模式是 Istio 在 1.11 版本中提出的实验特性 —— 基于 gRPC 和 Istio 的无 sidecar 代理的服务网格。使用该模式可以直接将 gRPC 服务添加到 Istio 中,而不需要再向 Pod 中注入 Envoy 代理。下图展示了 sidecar 模式与 proxyless 模式的对比图。
从上图中我们可以看到,虽然 proxyless 模式不使用 proxy 进行数据平面通信,但仍然需要一个 agent(即 pilot-agent
)来进行初始化和与控制平面的通信。首先,agent 在启动时生成一个引导文件,与为 Envoy 生成引导文件的方式相同。这告诉 gRPC 库如何连接到 istiod
,在哪里可以找到用于数据平面通信的证书,向控制平面发送什么元数据。接下来,agent 作为 xDS proxy,代表应用程序与 istiod
进行连接和认证。最后,agent 获取并轮换数据平面通信中使用的证书,这其实与 Sidecar 模式的流程是一样的,只是将 Envoy 代理的功能内置到 SDK 中了。
服务网格的本质不是 Sidecar 模式,也不是配置中心或透明流量拦截,而是标准化的服务间通信标准。
有人说 proxyless 模式又回到了基于 SDK 开发微服务的老路,服务网格的优势丧失殆尽,那还能叫做服务网格吗 8?其实这也是一种对性能的妥协 —— 如果你主要使用 gRPC 来开发微服务的话,只需要维护不同语言的 gRPC 版本,即可以通过控制平面来管理微服务了。
Envoy xDS 已经成为服务网格中服务间通信的事实标准。
在透明流量劫持一节,我们可以看到一个服务间的流量在到达目的地 pod 时经过的 iptables 规则和路径,其中需要经过多条 iptables 规则,如 PREROUTING
、ISTIO_INBOUND
、ISTIO_IN_REDIRECT
、OUTPUT
、ISTIO_OUTPUT
、POSTROUTING
等。假设现在有一个服务 A 想要调用非本地主机上的另一个 pod 中的服务 B,经过的网络堆栈如下图所示。
从图中我们可以看到整个调用流程中经过四次 iptables,其中 Pod A 中的从 Envoy 的出站(iptables2)和 Pod B 中的从 eth0 的入站(iptables3)的 iptables 路由是无法避免的,那么剩下的两个 iptables1 和 iptables4 是否可以优化呢?让两个 socket 直接通信,不就可以缩短网络路径了吗?这就需要通过 eBPF 编程,使得:
使用 eBPF 模式的透明流量拦截网络路径如下图所示。
如果要访问的服务 A 和服务 B 在同一个节点上,那么网络路径将更短。
同一个节点中的服务间访问完全绕过了 TCP/IP 堆栈,变成了 socket 间的直接访问。
我们知道修改 Linux 内核代码很难,新特性发布到内核中需要很长的周期。eBPF 是一个框架,允许用户在操作系统的内核内加载和运行自定义程序。也就是说,有了 eBPF,你不需要直接修改内核,就可以扩展和改变内核的行为。下面我将简要的为大家介绍一下 eBPF:
由于 eBPF 程序可以直接监听和操作 Linux 内核,具有对系统最底层的透视,就可以在流量管理、可观测性和安全发挥作用。有关 eBPF 的详细介绍请参考笔者翻译的《什么是 eBPF》电子书。
开源项目 Merbridge 正是利用 eBPF 缩短了透明流量劫持的路径,优化了服务网格的性能。关于 Merbridge 实现的一些细节,请参考 Istio 博客。
乍看上去 eBPF 似乎从更底层实现了 Istio 的功能,更大有取代 sidecar 的趋势。但是 eBPF 也存在很多局限性,导致在可以预见的未来无法取代服务网格和 Sidecar。如果取消 sidecar 转而使用每个主机一个代理的模式,会导致:
而且 eBPF 主要负责三/四层流量,可以与 CNI 一起运行,但是七层流量使用 eBPF 来处理就不太合适了。
在可以预见的未来 eBPF 技术无法取代服务网格和 Sidecar。
关于 eBPF 与服务网格的关系的更详细介绍请参考博客请暂时抛弃使用 eBPF 取代服务网格和 Sidecar 模式的幻想。
以上两种优化都是针对数据平面进行的,我们再来看下控制平面的性能优化。你可以把服务网格想象成是一场演出,控制平面是总导演,数据平面是所有演员,导演不参与演出,但是负责指挥演员。如果这场演出的情节很简单,时长又很短,那要每个演员分配的戏份就会很少,排练起来就会很容易;如果是一个大型演出,演员的数量多,情节有很复杂,要想排练好这场演出,一个导演可能是不够的,他指挥不了这么多演员,因此我们需要多名副导演(扩大控制平面实例数量);我们还需要给演员准备好台词和脚本,如果演员也可以一个镜头完成一连串的台词和场景的表演(减少都数据平面的打扰,批量推送更新),那我们的排练是不是更加高效?
从上面的类比中,你应该可以找到控制平面性能优化的方向了,那就是:
控制平面性能优化最直接的方式就是减少要向数据平面推送的代理配置大小。假设有工作负载 A,如果仅将与 A 相关的代理配置(即 A 依赖的服务)推送给 A,而不是将网格内所有服务的配置都推送给 A,这样就可以大大压缩要推送的工作负载范围及配置大小。Istio 中的 Sidecar 资源可以帮助我们实现这一点。下面是 Sidecar 配置示例:
apiVersion: networking.istio.io/v1alpha3
kind: Sidecar
metadata:
name: default
namespace: cn-bj
spec:
workloadSelector:
labels:
app: app-a
egress:
- hosts:
- "cn-bj/*"
我们通过 workloadSelector
字段可以限制该 Sidecar 配置适用的工作负载范围,而 egress
字段可以确定该工作负载依赖的服务范围,这样控制平面就可以仅向服务 A 推送其依赖的服务配置,大大减低要向数据平面推送的配置大小,减少了服务网格的内存和网络消耗。
控制平面 Istiod 向数据平面推送代理配置的过程比较复杂,下图展示了其中的流程。
管理员配置 Istio 网格后,Istiod 中推送代理配置的流程是这样的:
DiscoveryServer
组件监听到这些事件后不会立即将配置推送到数据平面,而是将这些事件添加到队列中,持续合并一段时间内的事件,这个过程叫做去抖动(debouncing),就是为了防止频繁的更新数据平面配置;从以上流程中我们可以看出,优化配置推送的关键就是步骤 2 中去抖动周期和步骤 4 中的限流设置。有这样几个环境变量可以帮助你设置控制平面的推送:
PILOT_DEBOUNCE_AFTER
:指定去抖动的时间,将事件添加到推送队列中,默认为 100 毫秒;PILOT_DEBOUNCE_MAX
:指定允许事件去抖动的最长时间,如果在这段时间内事件没有新的变化则推送事件,默认为 10 秒;PILOT_ENABLE_EDS_DEBOUNCE
:指定端点更新是否符合去抖动规则或具有优先权并立即落入推送队列,默认是开启的,关闭它后可以加速 EDS 推送;PILOT_PUSH_THROTTLE
:指定同时处理的推送请求,默认是 100;关于这些环境变量的默认值和具体配置请参考 Istio 文档。
这些值究竟如何设置,可以遵循以下原则:
至于如何设置最优解,需要结合你的可观测系统来调试。
如果设置去抖动批处理和 Sidecar 还无法优化控制平面性能的话,最后的选择就是扩大控制平面的规模,包括扩大单个 Istiod 实例的资源和增加 Istiod 的实例个数,究竟采用哪种扩展方式视情况而定:
Apache SkyWalking 可以作为 Istio 提供可观测性工具,还可以帮助我们在进行服务动态调试和故障排除剖析服务的性能,其最新推出的 Apache SkyWalking Rover 组件可以利用 eBPF 技术来准确定位 Istio 的关键性能问题 9。在数据平面,我们可以通过以下方式来增加 Envoy 的吞吐量以优化 Istio 的性能:
以上优化方式对 Envoy 吞吐量的影响数据请参阅 使用 eBPF 准确定位服务网格的关键性能问题。
我们知道服务网格是由数据平面和控制平面组成的,从上面的服务网格开源项目列表中我们可以看到,服务网格开源项目大部分都是基于 Envoy,然后开发自己的控制平面。还记得我在本文前面将服务网格比作演出吗?在这场服务网格的演出中,毫无疑问 Envoy 就是领衔主演 —— Envoy 发明的 xDS 协议,基本成为服务网格的通用 API。下面展示的是 Envoy 的架构图。
xDS 是 Envoy 区别于其他代理的关键,它的代码和解析流程十分复杂 10,直接扩展起来也很有难度。下面展示的是 Istio 组件拓扑图,从图中我们可以看到 Istio 数据平面的 Sidecar 容器中不止有 envoy
这一个进程,还有一个 pilot-agent
进程。
pilot-agent
进程的作用如下:
envoy
的父进程,负责 Envoy 的生命周期管理;从以上功能中我们可以看出 pilot-agent
进程主要是用于与 Istiod 交互,为 Envoy 起到指挥和辅助的作用,Istio 的核心组件是 Envoy。那么 Envoy 会不会「演而优则导」,不再配合 Istio,构建一套自己的控制平面呢?
在 Sidecar 容器中,
pilot-agent
就像是 Envoy 的“Sidecar”。
pilot-agent
的功能能否直接内置到 Envoy 中,从而取消 pilot-agent
呢?
在 Kubernetes 中,除 Service 资源对象之外,最早用来暴露集群中服务的资源对象是 Ingress。使用 Ingress 你只需要为集群开放一个对外的访问点即可,通过 HTTP Hosts 和 path
来路由流量到具体的服务。相对于直接在 service
资源上暴露服务来说,可以减少集群的网络访问点(PEP)11 ,降低集群被网络攻击的风险。使用 Ingress 访问集群内的服务流程如下图所示。
在 Kubernetes 之前,API Gateway 软件就已经被广泛用作边缘路由了,在引用 Istio 时又增加了 Istio 自定义的 Gateway 资源,使得访问 Istio 服务网格中的资源又多了一种选择,如下图所示。
现在,要想暴露单个 Istio 网格中的服务,NodePort
、LoadBalance
、Istio 自定义 Gateway、Kubernetes Ingress 和 API Gateway 软件,如何选择?如果是多集群服务网格,客户端如何访问网格内的服务?我们的服务网格领衔主演 Envoy 已经在这方面做足了功夫,被以多种形式使用:
这些项目利用 Envoy 来实现服务网格和 API 网关,其中有很多功能重叠,同时又有很多专有功能,或者缺乏社区多样性,这种现状由于 Envoy 社区没有提供控制平面实现而导致的。为了改变现状,Envoy 社区发起了 Envoy Gateway 项目,该项目旨在结合现有的基于 Envoy 的 API Gateway 相关项目的经验 12,利用带有一些 Envoy 特定扩展的 Kubernetes Gateway API 降低 Envoy 用户使用网关的门槛。因为 Envoy Gateway 仍然通过 xDS 下发配置给 Envoy 代理,因此你还可以用它来管理支持 xDS 的网关,如 Istio Gateway。
我们现在所见的网关基本都是在单集群中作为入口网关,对于多集群和多网格就无能为力了。为了应对多集群,我们需要在 Istio 之上再添加一层网关,和一个全局的控制平面以在多集群间路由流量,如下图所示。
通过在 Istio 控制平面以外增加一层全局控制平面和 API,来实现多集群服务网格管理。将 T1 网关部署为集群,可以防止单点故障。想要了解关于两级网关的更多内容,请参考通过两级网关设计来路由服务网格流量。
T1 网关的配置如下所示:
apiVersion: gateway.tsb.tetrate.io/v2
kind: Tier1Gateway
metadata:
name: service1-tier1
group: demo-gw-group
organization: demo-org
tenant: demo-tenant
workspace: demo-ws
spec:
workloadSelector:
namespace: t1
labels:
app: gateway-t1
istio: ingressgateway
externalServers:
- name: service1
hostname: servicea.example.com
port: 80
tls: {}
clusters:
- name: cluster1
weight: 75
- name: cluster2
weight: 25
该配置将 servicea.example.com
通过 T1 网关暴露到网格外,并将网格外访问该服务的流量的 75%
转发到 cluster1
,25%
的流量转发到 cluster2
,另外为了应对多集群中的流量、服务和安全配置,Tetrate 旗舰产品 Tetrate Service Bridge 中还增加了 一系列 Group API,详见 TSB 文档。
Istio 开源在至今已经五年多了,近两年来出现了很多基于 Istio 的开源项目,其中比较代表性的有:
它们的出现使得 Istio 更加智能化并扩展了 Istio 的适用范围。
Slime 是由网易数帆微服务团队开源的一款基于 Istio 的智能网格管理器。Slime 基于 Kubernetes Operator 实现,可作为 Istio 的 CRD 管理器,无须对 Istio 做任何定制化改造,就可以定义动态的服务治理策略,从而达到自动便捷使用 Istio 和 Envoy 高阶功能的目的。
我们在前文的控制平面性能优化中提到了通过「减少需要推送的配置」的方式来优化 Istio 的性能,但是 Istio 无法做到自动识别无法依赖以最优化需要推送到每个 sidecar 的代理配置,Slime 提供了 lazyload
控制器,可以帮助我们实现配置懒加载,用户无须手动配置 SidecarScope
13,Istio 可以按需加载服务配置和服务发现信息。
下图展示的是 Slime 作为 Istio 的管理平面更新数据平面配置的流程图。
其中,Global Proxy 使用 Envoy 构建,在每个需要启动配置懒加载的命名空间中部署一个或在整个网格中只部署一个,所有缺失服务发现信息的调用(你也可以手动配置服务调用关系),都会被兜底路由劫持到 Global Proxy,经过其首次转发后,Slime 便可感知到被调用方的信息,然后根据其对应服务的 VirtualService,找到服务名和真实后端的映射关系,将两者的都加入 SidecarScope,以后该服务的调用就不再需要经过 Global Proxy 了。
数据平面配置更新的具体步骤如下:
因为数据平面中的所有服务的首次调用都通过 Global Proxy,该 Proxy 可以记录所有服务的调用和依赖信息,根据该依赖信息更新 Istio 中 Sidecar 资源的配置;当某个服务的调用链被 VirtualService 中的路由信息重新定义时,Global Proxy 原有记录就失效了,需要一个新的数据结构来维护该服务的调用关系。Slime 创建了名为 ServiceFence
的 CRD 来维护服务调用关系以解决服务信息缺失问题,详见 Slime 简介。
Aeraki Mesh 是腾讯云在 2021 年 3 月开源的一个服务网格领域的项目,基于 Istio 扩展其对七层协议的支持,专注于解决 Istio 中的非 HTTP 协议的服务治理,已于 2022 年 6 月进入 CNCF Sandbox。
下图展示了 Aeraki 将非 HTTP 协议纳入到 Istio 网格中的流程图。
其详细流程如下:
tcp-metaprotocol-dubbo
),然后生成 MetaProtocol Proxy Filter(兼容 EnvoyFilter)配置,同时修改 RDS 地址,将其指向 Aeraki;在 Istio 中接入非 HTTP 服务的整个流程中的关键是 MetaProtocol Proxy 。Istio 默认支持 HTTP/HTTP2、TCP 和 gRPC 协议,实验性支持 Mongo、MySQL 和 Redis 协议 14。若要使用 Istio 路由其他协议的流量,不仅需要修改 Istio 控制平面并扩展 Envoy,这将带来巨大的工作量,而且不同协议共享通用的控制逻辑,这还会带来很多重复性工作。MetaProtocol Proxy 是在 Envoy 代码基础上的扩展,为七层协议统一实现了服务发现、负载均衡、RDS 动态路由、流量镜像、故障注入、本地/全局限流等基础能力,大大降低了在 Envoy 上开发第三方协议的难度。
下图展示的 MetaProtocol Proxy 的架构图。
当我们想扩展 Istio 使其支持 Kafka、Dubbo、Thrift 等其他七层协议时,只需要实现上图中的编解码的接口(Decode 和 Encode),就可以基于 MetaProtocol 快速开发一个第三方协议插件。MetaProtocol Proxy 是在 Envoy 基础上的扩展,因此你仍然可以使用多种语言为其开发过滤器,并使用 EnvoyFilter
资源将配置下发到数据平面。
WasmPlugin 是 Istio 1.12 版本引入的 API,作为代理扩展机制,我们可以使用它将自定义和第三方的 Wasm 模块添加到数据平面中。下图中展示了如何在 Istio 中使用 WasmPlugin。
具体步骤如下:
WasmPlugin
配置并应用到 Istio;WasmPlugin
配置中的工作负载选择配置,将 Wasm 模块注入到指定的 Pod 中;pilot-agent
15 从远程或本地文件中获取 Wasm 模块并将其加载到 Envoy 中运行;好了,说了这么说,这跟你有什么关系呢?Istio 跟你的关系取决于你的角色:
下图展示了服务网格的采用路径。
是否采用服务网格取决于你公司的技术发展阶段,应用是否实现容器化和微服务,对多语言的需求,是否需要 mTLS 以及对性能损耗的接纳度等。
技术的发展日新月异,近两年来有一些新技术出现,似乎挑战了服务网格的地位,更有人声称可以直接取代现有经典的 sidecar 模式的服务网格 16,我们不要被外界嘈杂的声音所迷惑,认清服务网格在云原生技术栈中的定位。
一味地推广某项技术而忽略它的适用场景,就是耍流氓。
下图展示的是云原生技术堆栈。
我们可以看到,在云原生技术堆栈图中的「云基础设施」、「中间件」和「应用」层都列举了一些标志性的开源项目,这些项目构建了它们所在领域的标准:
下图展示了 Istio 在云原生部署中定位于七层网格管理。
在云原生技术栈中,Istio 和 Dapr 同时位于中间件层,它们之间有很多区别和联系。
Istio 和 Dapr 之间的相同点:
Istio 和 Dapr 之间的不同点:
我在前文中介绍了 Istio 的发展脉络及开源生态,接下来我将为大家介绍 Istio 服务网格的未来趋势:
服务网格的未来在于成为零信任网络和混合云的基础设施。
这也是笔者所在的公司企业级服务网格提供商 Tetrate 的努力方向,我们致力于构建一个基于零信任的适用于任意环境、任意负载的应用感知网络。下面展示的是 Tetrate 旗舰产品 Tetrate Service Bridge 的架构图。
Tetrate 公司是由 Istio 项目的发起人创立的,TSB 是基于开源的 Istio、Envoy 和 Apache SkyWalking 开发的。我们同时积极得贡献上游社区,并参与了旨在简化将 Envoy 网关使用的 Envoy Gateway 项目的创建(上图中的 XCP 即使用 Envoy 构建的网关)。
零信任(Zero Trust)是 IstioCon 2022 里的一个重要话题,Istio 正在成为零信任网络的一个重要组成部分。
零信任网络中最重要的是面向身份的控制而不是面向网络的控制。Istio 1.14 中增加了对 SPIRE 的支持,SPIRE(SPIFFE Runtime Environment,CNCF 孵化项目)是 SPIFFE(Secure Production Identity Framework For Everyone,CNCF 孵化项目)的一个实现。在 Kubernetes 中我们使用 ServiceAccount 为 Pod 中的工作负载提供身份信息,其核心是基于 Token(使用 Secret 资源存储)来表示负载身份。而 Token 是 Kubernetes 集群中的资源,对于多集群及运行在非 Kubernetes 环境(例如虚拟机)中的负载,如何统一它们的身份?这就是 SPIFFE 要解决的问题。
SPIFFE 的目的是基于零信任的理念,建立一个开放、统一的工作负载身份标准,这有助于建立一个零信任的全面身份化的数据中心网络。SPIFFE 的核心是通过简单 API 定义了一个生命周期短暂的加密身份文件—— SVID(SPFFE Verifiable Identity Document),用作工作负载认证时使用的身份文件(基于 X.509 证书或 JWT 令牌)。SPIRE 可以根据管理员定义的策略自动轮换 SVID 证书和秘钥,动态地提供工作负载标识,同时 Istio 可以通过 SPIRE 动态的消费这些工作负载标识。
基于 Kubernetes 的 SPIRE 架构图如下所示。
Istio 中原先是使用 Istiod 中 Citadel 服务 17 负责服务网格中证书管理,通过 xDS(准确的说是 SDS API)协议将证书下发给数据平面。有了 SPIRE 之后,证书管理的工作就交给了 SPIRE Server。SPIRE 同样支持 Envoy SDS API,我们在 Istio 中启用 SPIRE 之后,进入工作负载 Pod 中的流量在被透明拦截到 Sidecar 中后,会经过一次身份认证。身份认证的目的是对比该工作负载的身份,与它所运行的环境信息(所在的节点、Pod 的 ServiceAccount 和 Namespace 等)是否一致,以防止伪造身份。请参考如何在 Istio 中集成 SPIRE 以了解如何在 Istio 中使用 SPIRE 做身份认证。
我们可以使用 Kubernetes Workload Registrar 在 Kubernetes 中部署 SPIRE,它会为我们自动注册 Kubernetes 中的工作负载并生成 SVID。该注册机是 Server-Agent 架构,它在每个 Node 上部署一个 SPIRE Agent,Agent 与工作负载通过共享的 UNIX Domain Socket 通信。零信任网络中每个流量会话都需要经过身份认证,Istio 在透明流量劫持时,Sidecar 同时对流量请求进行身份认证。下图展示了在 Istio 中使用 SPIRE 进行身份认证的过程。
Istio 中使用 SPIRE 进行工作负载认证的步骤如下:
pilot-agent
通过共享的 UDS 调用 SPIRE Agent 来获取 SVID 并缓存在 SPIRE Agent 中用于后续身份认证;关于工作负载的注册和认证的详细过程请参考 SPIRE 文档 。
当每个工作负载都有准确的身份之后,如何对这些身份的权限进行限制?Kubernetes 中默认使用 RBAC 来做访问控制,正如其名,这种访问控制是基于角色的,虽然使用起来比较简单,但是对于大规模集群,存在角色爆炸问题 —— 即存在太多角色,而且角色的类型不是一成不变的,难以对角色权限机型跟踪和审计。另外 RBAC 中的角色的访问权限是固定,没有规定短暂的使用权限,也没有考虑位置、时间或设备等属性。使用 RBAC 的企业很难满足复杂的访问控制要求,以满足其他组织需求的监管要求。
NGAC,即下一代访问控制,采用将访问决定数据建模为 DAG(有向无环图)的方法。NGAC 可以实现系统化、策略一致的访问控制方法,以高精细度授予或拒绝用户管理能力。NGAC 由 NIST (美国国家标准与技术研究所)开发,目前已用于 Tetrate Service Bridge 中的权限管理。关于为什么选择 NGAC,而不是 ABAC 和 RBAC 的更多内容请参考博客为什么应该选择使用 NGAC 作为权限控制模型。
在实际应用中,我们可能出于负载均衡、隔离开发和生产环境、解耦数据处理和数据存储、跨云备份和灾难恢复以及避免厂商锁定等原因,在多种环境下部署多个 Kubernetes 集群。Kubernetes 社区提供了「集群联邦」功能可以帮助我们创建多集群架构,例如下图所示的一种常用的 Kubernetes 多集群架构,其中 Host Cluster 作为控制平面,有两个成员集群,分别是 West 和 East。
集群联邦要求 Host 集群与成员集群的之间的网络能够互通,对成员集群之间的网络连接性没有要求。Host 集群作为 API 入口,外界所有对 Host 集群的资源请求会转发到成员集群中。Host 集群中部署有集群联邦的控制平面,其中的「Push Reconciler」会将联邦中的身份、角色及角色绑定传播到所有的成员集群中。集群联邦只是简单地将多个集群简单的「连接到了一起」,在多个集群之间复制工作负载,而成员集群之间的流量无法调度,也无法实现真正的多租户。
集群联邦不足以实现混合云,为了实现真正意义上的混合云,就要让集群之间做到互联互通,同时实现多租户。TSB 在 Istio 之上构建一个多集群管理的通用控制平面,然后再增加一个管理平面来管理多集群,提供多租户、管理配置、可观测性等功能。下面是 Istio 管理平面的多租户和 API 示意图。
TSB 为管理混合云,基于 Istio 构建了一个管理平面,新建了 Tenant 和 Workspace 的资源,并通过选择器,将网关组、流量组和安全组应用到对应集群中的工作负载上。关于 TSB 的详细架构请参考 TSB 文档。
如果你想了解更多关于 Istio 和云原生的内容,下面有一些资料分享给你:
有关 Envoy 开源的详细过程,推荐你阅读 Envoy 作者 Matt Klein 的这篇文章网络代理 Envoy 开源五周年,创始人 Matt Klein 亲述开源心路历程及经验教训。 ↩︎
后来 IBM 与 Google 反目,大举抨击 Google 没有遵守将 Istio 捐献给 CNCF 的约定,Google 对 Istio 商标的管理也受到了质疑。 ↩︎
2018 年,CNCF 为云原生的重新定义是:云原生技术有利于各组织在公有云、私有云和混合云等新型动态环境中,构建和运行可弹性扩展的应用。云原生的代表技术包括容器、服务网格、微服务、不可变基础设施和声明式 API。 ↩︎
Day-2 Operation 是在系统的生命周期结束前,对系统不断改进的过程,以实现效益最大化。参考 什么是 Day-2 Operation。 ↩︎
Istio 现已推出 proxyless 模式测试版,详见 基于 gRPC 和 Istio 的无 sidecar 代理的服务网格。 ↩︎
Kubernetes 预计推出 Gateway API,Istio 也有计划使用 Kubernetes 的 Gateway API 替换当前 Istio 自定义的 Gateway 资源。 ↩︎
有关服务网格项目的详细对比请参考 servicemesh.es 网站。 ↩︎
在百度的服务网格团队分享的 殊途同归,Proxyless Service Mesh 在百度的实践与思考 这篇文章里,详细介绍了百度的服务网格采用路径,以及对服务网格本质的探索。 ↩︎
Apache SkyWalking 的 Rover 组件利用 eBPF 技术改进了 SkyWalking 的剖析功能,可用于分析服务网格的性能问题,请参考 使用 eBPF 准确定位服务网格的关键性能问题。 ↩︎
关于 xDS 协议,请参考 Envoy 中的 xDS REST 和 gRPC 协议详解 这篇文章。 ↩︎
PEP,全称 Policy Enforcement Point,策略执行点(PEP)是控制用户访问并确保策略决策点 (PDP) 做出授权决策的网络或安全设备。在一些 NAC 实现中,PDP 是有线交换机或无线接入点。在其他情况下,PEP 是防火墙、IPS、服务器或内联设备。根据实施情况,PEP 和 PDP 可以是独立设备,也可以合并为单个设备。 ↩︎
有多家公司正在合作开发 Envoy Gateway,包括 Ambassador Labs、Fidelity Investments、Project Contour 和 VMware。 ↩︎
SidecarScope 是在 Istio 1.1 版本中引入的,它并不是一个直接面向用户的配置项,而是 Sidecar 资源的包装器,具体来说就是 Sidecar 资源中的 egress
选项。通过该配置可以减少 Istio 向 Sidecar 下发的数据量,例如只向某个命名空间中的某些服务下发某些 hosts 的访问配置,从而提高应用提高性能。 ↩︎
Istio 仅可以路由 TCP 流量,默认支持 HTTP、HTTPS、gRPC 和原始 TCP 协议,其中 Sidecar 和 Gateway 所支持的协议范围有所不同,详见 Istio 文档。 ↩︎
pilot-agent
是 sidecar 容器中的主进程,你可以在 Istio 的组成架构图中看到。pilot-agent
中的镜像提取机制(在 Istio 1.9 中引入),从远程 HTTP 源可靠地检索 Wasm 二进制文件,已被扩展到支持从任何 OCI 注册处检索 Wasm OCI 镜像,包括 Docker Hub、Google Container Registry(GCR)、Amazon Elastic Container Registry(Amazon ECR)和其他地方。 ↩︎
《告别 Sidecar—— 使用 eBPF 解锁内核级服务网格》这篇文章在云原生社区里引起了一系列关于服务网格将被 eBPF 技术所取代的讨论。请暂时抛弃使用 eBPF 取代服务网格和 sidecar 模式的幻想,不管有没有 eBPF,在可预见的未来,服务网格都会基于运行在用户空间的 sidecar 代理(proxyless 模式除外)。 ↩︎
Istio 具有身份和证书管理功能,可以实现服务间的终端用户认证,在控制平面还采用微服务架构的时候,其中的 Citadel 组件负责证书管理,在 Istio 1.5 版本被合并到单体 Istiod 中了。 ↩︎
最后更新于 2025/01/10