kubernetes-handbook/practice/openkruise.md

352 lines
13 KiB
Markdown
Raw Normal View History

2020-06-19 14:47:22 +08:00
# OpenKruise
2021-12-23 20:07:44 +08:00
[OpenKruise](https://openkruise.io/) 是阿里云开源的大规模应用自动化管理引擎,于 2021 年 12 月[发布 1.0](https://openkruise.io/zh/blog/openkruise-1.0) 。在 Kubernetes 原生 Deployment/StatefulSet 等控制器基础上,提供了更多的增强功能如:
2020-06-19 17:55:41 +08:00
2021-12-23 20:07:44 +08:00
- **应用工作负载**面向无状态、有状态、daemon 等多种类型应用的高级部署发布策略,例如原地升级、灰度流式发布等。
- **Sidecar 容器管理**:支持独立定义 sidecar 容器,完成动态注入、独立原地升级、热升级等功能。
- **增强运维能力**:包括容器原地重启、镜像预拉取、容器启动顺序保障等。
- **应用分区管理**:管理应用在多个分区(可用区、不同机型等)上的部署比例、顺序、优先级等。
- **应用安全防护**:帮助应用在 Kubernetes 之上获得更高的安全性保障与可用性防护。
2020-06-19 17:55:41 +08:00
2020-06-21 15:18:04 +08:00
这些控制器可以帮助开发者应对更加多样化的部署环境和需求、为集群维护者和应用开发者带来更加灵活的部署发布组合策略。
## 扩展控制器
2021-12-22 17:25:18 +08:00
Kruise 是 OpenKruise 中的核心项目之一,它提供一套在 [Kubernetes 核心控制器](https://kubernetes.io/docs/concepts/overview/what-is-kubernetes/)之外的扩展 workload 管理和实现。目前Kruise 提供了以下多个 Kubernetes 扩展控制器:
**通用工作负载**
- **CloneSet**: 提供了更加高效、确定可控的应用管理和部署能力,支持优雅**原地升级**、指定删除、发布顺序可配置、并行/灰度发布等丰富的策略,可以满足更多样化的应用场景。
- **AdvancedStatefulSet**:基于原生 [StatefulSet](../concepts/statefulset.md) 之上的增强版本,默认行为与原生完全一致,在此之外提供了原地升级、并行发布(最大不可用)、发布暂停等功能。
- **AdvancedDaemonSet**:基于原生 [DaemonSet](../concepts/daemonset.md) 上增强了发布能力,比如灰度分批、按 Node label 选择、暂停、热升级等。
**任务工作负载**
- **BroadcastJob**:配置一个 job在集群中所有满足条件的 Node 上都跑一个 Pod 任务。
- **AdvancedCronJob**:基于原生 CronJob 的扩展版本。 根据用户设置的 schedule 规则,周期性创建 Job 执行任务,而 AdvancedCronJob 的 template 支持多种不同的 job 资源。
**Sidecar 容器管理**
- **SidecarSet**:对 sidecar 容器做统一管理,在满足 selector 条件的 Pod 中注入指定的 sidecar 容器。
**多区域管理**
- **WorkloadSpread**:将 workloadPod按一定规则分布到不同类型的节点上赋予单一 workload 多区域部署和弹性部署的能力。
2020-06-21 15:18:04 +08:00
2021-12-22 17:25:18 +08:00
- **UnitedDeployment**:通过多个 workload 管理多个区域下的 Pod。
2020-06-21 15:18:04 +08:00
2020-06-22 15:18:29 +08:00
**关于命名规范**
Kruise 中的扩展控制器采用与 Kubernetes 社区一致的命名规范:
- `Set` 后缀:这类 controller 会直接操作和管理 Pod比如 `CloneSet`、`ReplicaSet`、`SidecarSet` 等。它们提供了 Pod 维度的多种部署、发布策略。
- `Deployment` 后缀:这类 controller 不会直接地操作 Pod它们通过操作一个或多个 `Set` 类型的 workload 来间接管理 Pod比如 `Deployment` 管理 `ReplicaSet` 来提供一些额外的滚动策略,以及 `UnitedDeployment` 支持管理多个 `StatefulSet`/`AdvancedStatefulSet` 来将应用部署到不同的可用区。
- `Job` 后缀:这类 controller 主要管理短期执行的任务,比如 `BroadcastJob` 支持将任务类型的 Pod 分发到集群中所有 Node 上。
2021-12-22 17:25:18 +08:00
## CloneSet
2020-06-21 15:18:04 +08:00
2021-12-22 17:25:18 +08:00
CloneSet 是对 [Deployment](../concepts/deployment.md) 的增强版,主要用于管理对实例顺序没有要求的无状态应用。
2020-06-22 15:18:29 +08:00
下面是一个 CloneSet 的配置示例。
```yaml
apiVersion: apps.kruise.io/v1alpha1
kind: CloneSet
metadata:
labels:
app: sample
name: sample-data
spec:
replicas: 3
scaleStrategy:
podsToDelete:
- sample-9m4hp # 选择性的删除单个 pod
updateStrategy:
priorityStrategy: # 优先级策略
weightPriority: #
- weight: 50
matchSelector:
matchLabels:
test-key: foo
- weight: 30
matchSelector:
matchLabels:
test-key: bar
orderPriority:
- orderedKey: some-label-key
scatterStrategy:
- key: foo
value: bar
updateStrategy: # 升级策略
type: InPlaceIfPossible # 升级策略里增加了原地升级
maxUnavailable: 2 # 升级时最多有多少个实例不可用
selector:
matchLabels:
app: sample
template:
metadata:
labels:
app: sample
spec:
containers:
- name: nginx
image: nginx
volumeMounts:
- name: data-vol
mountPath: /usr/share/nginx/html
volumeClaimTemplates: # 为 每个 Pod 设置 PVC
- metadata:
name: data-vol
spec:
accessModes: [ "ReadWriteOnce" ]
resources:
requests:
storage: 10Gi
```
**CloneSet 是对 Deployment 的增强**
对于 Kubernetes 原生支持的 Deployment 控制器, CloneSet 在以下方面做出了增强:
- 支持原地升级In Place Update需要在 `updateStrategy` 中配置,默认的升级策略为 `ReCreate`
- 支持为每个 Pod 设置 PVC
- 支持选择性的删除某个 Pod
- 更加高级的升级和发布策略;
2021-12-22 17:25:18 +08:00
关于 CloneSet 的详细描述请见[官方文档](https://openkruise.io/zh/docs/user-manuals/cloneset)。
2020-06-21 15:18:04 +08:00
2021-12-22 17:25:18 +08:00
## AdvancedStatefulSet
2020-06-22 15:18:29 +08:00
2021-12-22 17:25:18 +08:00
AdvancedStatefulSet 是对 Kubernetes 原生的 [StatefulSet](../concepts/statefulset.md) 的增强。
2020-06-22 15:18:29 +08:00
下面是一个 AdvancedStatefulSet 的配置示例。
```yaml
apiVersion: apps.kruise.io/v1alpha1
kind: StatefulSet
metadata:
name: sample
spec:
replicas: 3
serviceName: my-service
selector:
matchLabels:
app: sample
template:
metadata:
labels:
app: sample
spec:
readinessGates:
# 一个新的条件,确保 pod 在原地更新时保持在 NotReady 状态。
- conditionType: InPlaceUpdateReady
containers:
- name: nginx
image: nginx:alpine
podManagementPolicy: Parallel # 允许并行更新,与 maxUnavailable 一起使用。
updateStrategy:
type: RollingUpdate
rollingUpdate:
# 如果可以的话做原地更新,目前原地更新只支持镜像更新。
podUpdatePolicy: InPlaceIfPossible
# 允许并行更新,最大不可用实例数等于 2。
maxUnavailable: 2
# 可以按照特定的顺序更新 pod而不是按照 pod 名称的顺序。
unorderedUpdate:
priorityStrategy:
weightPriority:
- weight: 50
matchSelector:
matchLabels:
test-key: foo
- weight: 30
matchSelector:
matchLabels:
test-key: bar
```
**AdvancedStatefulSet 是对 StatefulSet 的增强**
AdvancedStatefulSet 基本保留了 Kubernetes 原生的 [StatefulSet](../concepts/statefulset.md) 的使用用法。在声明 AdvancedStatefulSet 时保留了 CRD 的名字 `StatefulSet`,不过将原来的 `apiVersion` 的值从 `apps/v1` 修改为了 `apps.kruise.io/v1alpha1` ,并做出的如下方面的增强:
- 支持原地升级,同 CloneSet 一样,需要在 `updateStrategy` 中配置,默认的升级策略为 `ReCreate`
- 支持更高级的更新策略,例如根据权重按照特定的顺序更新 pod而不是按照 pod 的名称顺序;
2021-12-22 17:25:18 +08:00
关于 AdvancedStatefulSet 的详细描述请见[官方文档](https://openkruise.io/zh/docs/user-manuals/advancedstatefulset)。
2020-06-21 15:18:04 +08:00
2021-12-22 17:25:18 +08:00
## SidecarSet
2020-06-21 15:18:04 +08:00
2021-12-22 17:25:18 +08:00
SidecarSet 利用了 Kubernetes 的 mutating webhook 准入控制器,在 pod 创建时向其中自动注入 sidecar 容器,这个与 [Istio](https://istio.io) 的做法一致。
2020-06-22 15:18:29 +08:00
下面是一个 SidecarSet 的配置示例。
```yaml
apiVersion: apps.kruise.io/v1alpha1
kind: SidecarSet
metadata:
name: test-sidecarset
spec:
selector:
matchLabels:
app: nginx
strategy:
rollingUpdate:
maxUnavailable: 2
containers:
- name: sidecar1
image: centos:6.7
command: ["sleep", "999d"] # do nothing at all
volumeMounts:
- name: log-volume
mountPath: /var/log
volumes: # this field will be merged into pod.spec.volumes
- name: log-volume
emptyDir: {}
```
**SidecarSet 的主要功能**
Sidecar 容器的生命周期独立于整个 Pod实现如下功能
- SidecarSet 可以向指定的 Pod 中注入 Sidecar 容器;
- Sidecar 容器可以可原地升级(仅当更新镜像时);
2021-12-22 17:25:18 +08:00
关于 SidecarSet 的详细描述请见[官方文档](https://openkruise.io/zh/docs/user-manuals/sidecarset)。
2020-06-22 15:18:29 +08:00
2021-12-22 17:25:18 +08:00
## UnitedDeployment
2020-06-21 15:18:04 +08:00
2021-12-22 17:25:18 +08:00
UnitedDeployment 主要用于分组发布,通过定义 subset 将工作负载发布到不同的可用区中。Kubernetes 集群中的不同域由多组由标签识别的节点表示。UnitedDeployment 控制器为每组提供一种类型的工作负载,并提供相应匹配的 NodeSelector这样各个工作负载创建的 pod 就会被调度到目标域。
2020-06-22 15:18:29 +08:00
UnitedDeployment 管理的每个工作负载称为子集。每个域至少要提供运行 n 个副本数量的 pod 的能力。目前仅支持 StatefulSet 工作负载。下面的示例 YAML 展示了一个 UnitedDeployment它在三个域中管理三个 StatefulSet 实例。管理的 pod 总数为 6。
```yaml
apiVersion: apps.kruise.io/v1alpha1
kind: UnitedDeployment
metadata:
name: sample
spec:
replicas: 6
revisionHistoryLimit: 10
selector:
matchLabels:
app: sample
template:
statefulSetTemplate:
metadata:
labels:
app: sample
spec:
template:
metadata:
labels:
app: sample
spec:
containers:
- image: nginx:alpine
name: nginx
topology:
subsets:
- name: subset-a
nodeSelector:
nodeSelectorTerms:
- matchExpressions:
- key: node
operator: In
values:
- zone-a
replicas: 1
- name: subset-b
nodeSelector:
nodeSelectorTerms:
- matchExpressions:
- key: node
operator: In
values:
- zone-b
replicas: 50%
- name: subset-c
nodeSelector:
nodeSelectorTerms:
- matchExpressions:
- key: node
operator: In
values:
- zone-c
updateStrategy:
manualUpdate:
partitions:
subset-a: 0
subset-b: 0
subset-c: 0
type: Manual
...
```
**UnitedDeployment 的主要功能**
UnitedDeployment 主要功能即分组发布,控制不同可用区中的 StatefulSet 工作负载发布。
2021-12-22 17:25:18 +08:00
关于 UnitedDeployment 的详细描述请见[官方文档](https://openkruise.io/zh/docs/user-manuals/uniteddeployment)。
2020-06-22 15:18:29 +08:00
2021-12-22 17:25:18 +08:00
## BroadcastJob
2020-06-21 15:18:04 +08:00
2021-12-22 17:25:18 +08:00
BroadcastJob 控制器在集群中的每个节点上分发一个 Pod。像 DaemonSet 一样BroadcastJob 确保 Pod 被创建并在集群中的所有选定节点上运行一次。
2020-06-22 15:18:29 +08:00
BroadcastJob 在每个节点上的 Pod 运行完成后不会消耗任何资源。当升级一个软件,例如 Kubelet或者在每个节点上进行验证检查时BroadcastJob 特别有用,通常在很长一段时间内只需要一次,或者运行一个临时性的完整集群检查脚本。
BroadcastJob pod 也可以选择在所需节点上运行完成后保持存活,这样在每一个新节点被添加到集群后,就会自动启动一个 Pod。
2020-06-21 15:18:04 +08:00
2020-06-22 15:18:29 +08:00
下面是一个 BroadcastJob 的示例。
```yaml
apiVersion: apps.kruise.io/v1alpha1
kind: BroadcastJob
metadata:
name: broadcastjob-ttl
spec:
template:
spec:
containers:
- name: pi
image: perl
command: ["perl", "-Mbignum=bpi", "-wle", "print bpi(2000)"]
restartPolicy: Never
completionPolicy:
type: Always
ttlSecondsAfterFinished: 30
```
2021-12-22 17:25:18 +08:00
BroadcastJob 的支持多种 `CompletionPolicy``FailurePolicy` 设置,关于 BroadcastJob 的详细描述请见[官方文档](https://openkruise.io/zh/docs/user-manuals/broadcastjob)。
2020-06-21 15:18:04 +08:00
## 安装
使用 Helm v3 安装,并保证 Kubernetes 版本不低于 1.12。
```bash
helm install kruise https://github.com/openkruise/kruise/releases/download/v0.5.0/kruise-chart.tgz
```
默认启用所有支持的扩展控制器,若您想只启动指定的控制器,可以在执行上面的命令时设置环境变量,例如您想只启用 `CloneSet``StatefulSet`,可以加上这样的:
```bash
--set manager.custom_resource_enable="CloneSet,StatefulSet"
```
## 卸载
要想卸载 Kruise只需要执行下面的命令
```bash
helm delete kruise --namespace default
```
注意:卸载会导致所有 Kruise 下的资源都被删除,包括 webhook configurations、services、namespace、CRD、CR 实例和所有 Kruise workload 下的 Pod。 请务必谨慎操作!
2020-06-22 15:18:29 +08:00
## 总结
Kruise 在 Kubernetes 原生控制器基础上进行了扩展,主要增加了原地升级,更灵活的发布策略及多一些特殊场景的适配(如 SidecarSet、UnitedDeploymentCloneSet 可以完全替代 DeploymentAdvancedStatefulSet 可以完全替代 StatefulSet且使用方式都类似用户可以无负担的轻松接入。
2020-06-21 15:18:04 +08:00
## 参考
2021-12-22 17:25:18 +08:00
- [Kruise 官网 - openkruise.io](https://openkruise.io/zh/)