kubernetes-handbook/usecases/service-mesh-fundamental.md

6.3 KiB
Raw Blame History

Service Mesh基础

本文是对The Enterprise Path to Service Mesh Architecutures一书的解读。

微服务将原先的单体架构中的应用内通信转变为基于RPC的远程通信虽然这样提高了研发效率提高了开发语言选择的多样性但是随着单体应用的解体原先的巨石散落为石块变得四处都是如何管理这些微服务就成了难题。当微服务的个数少的时候还可以通过人工配置的方式去管理但随着业务规模的增大微服务的数量也可能呈指数级增长如何协调管理成百上千的服务这就需要有一套设计良好的框架。

一直以来都存在一个谬误那就是在分布式系统中网络是可靠的。实际上网络是不可靠的而且也是不安全的如何保证应用调用和事务的安全性与可靠性保护微服务的一个专门的基础设施层Service Mesh就应运而生。

Service Mesh是建立在物理或者虚拟网络层之上的基于策略的微服务的流量控制与一般的网络协议不同的是它有以下几个特点

  • 开发者驱动
  • 可配置策略
  • 服务优先的网络配置而不是协议

本章主要介绍Service Mesh的定义和组成为什么要使用Service Mesh它可以带来哪些好处。

Service Mesh模型对比

Service Mesh与传统网络的区别就是硬件或者虚拟网络软件定义网络SDN的区别我们从上图中可以看到物理和虚拟网络中比起SDN还多了管理平面

硬件网络中控制平面与数据平面紧耦合也就是说是与供应商绑定的管理平面是独立出来的。而SDN却给了我们很多自由度可以通过软件的形式自定义网络例如Kubernetes中的CNI

物理网络有很多种拓扑类型,如星形拓扑、总线拓扑、环形拓扑、树型拓扑、网状拓扑等,大家可以去搜索拓扑网络。不论是那种拓扑结构,总有一条路径可以从一个节点路由到另一个节点,只是不同的拓扑类型效率不同,管理的复杂度不一样罢了。

下图是网状拓扑所谓网状拓扑就是每个节点都可以跟所有其他节点直接互联这样而这也是链接数最多一种拓扑如果有n个节点的话链接数就是n(n-1)。

网状网络拓扑

Service Mesh架构

下图是Conduit Service Mesh现在已合并到Linkerd2中了的架构图这是Service Mesh的一种典型的架构。

Service Mesh架构图

Service Mesh中分为控制平面数据平面当前流行的两款开源的Service Mesh Istio和Linkerd实际上都是这种构造只不过Istio的划分更清晰而且部署更零散很多组件都被拆分控制平面中包括Mixer、Pilot、Citadel数据平面默认是用Envoy而Linkerd中只分为linkerd做数据平面namerd作为控制平面。

控制平面

控制平面的特点:

  • 不直接解析数据包
  • 与控制平面中的代理通信,下发策略和配置
  • 负责网络行为的可视化
  • 通常提供API或者命令行工具可用于配置版本化管理便于持续集成和部署

数据平面

数据平面的特点:

  • 通常是按照无状态目标设计的,但实际上为了提高流量转发性能,需要缓存一些数据,因此无状态也是有争议的
  • 直接处理入站和出站数据包,转发、路由、健康检查、负载均衡、认证、鉴权、产生监控数据等
  • 对应用来说透明,即可以做到无感知部署

Service Mesh的价值所在

Service Mesh中服务是一等公民它提供L5的网络流量管理并提供以下功能

可观察性

还是拿Istio做例子Mixer通过适配器将应用的遥测数据发送给后端监控、日志、认证和份额管理系统。

Istio Mixer

从上图可以看到Mixer适配器可以对接多种监控和日志后端。

流量控制

文中给出的例子是超时、重试、截止时间和速率限制。

安全性

下图是Istio中安全通信路径的示意图。

Istio架构图

一般的安全性都是通过证书的方式实现的。Sidecar代理负责证书生命周期的管理包括证书的生成、分发、刷新和注销。从图中还可以看到在Pod内部sidecar会与应用容器之间建立本地TCP连接其中使用mTLS双向传输层加密。这一点是非常重要的因为一个节点上甚至一个Pod内都不一定运行一个容器容器可能会被暴露到外部访问保证传输层的双向加密可以保证流量传输的安全。

延迟和故障注入

这个功能对于荣宰容灾和故障演练特别有用。通过人为的向系统中注入故障如HTTP 500错误通过分析分布式应用的行为检验系统的健壮性。

在L5解耦

这是本书最有重要的一个观点重要到要放到副标题熟悉OSI模型的人都知道L5是什么。

OSI模型

OSI模型图片来自CSDN

Service Mesh是在开发和运维之间植入的一个基础设施层。它将服务通信的关注点分离出来在TCP/IP层之上抽象出一层通用功能。Service Mesh的引入直接导致生产关系的改变进而提高生产效率。具体表现在

  • 运维人员在修改服务重试超时时间之前无需再知会开发人员
  • 客户成功部门在撤销客户的访问权限前无需再知会运维
  • 产品Owner可以针对特定服务,根据用户选择的套餐执行配额管理。
  • 开发人员可随时将新版本功能重定向到beta版本不需要运维人员干涉。

在L5解耦

这种职责的解耦大大加速了软件的迭代速度总之你可以把Service Mesh作为OSI模型中的会话层。