2018-05-11 11:07:14 +08:00
|
|
|
|
## 05-安装kube-node节点.md
|
2017-12-06 11:17:27 +08:00
|
|
|
|
|
2018-01-05 23:05:22 +08:00
|
|
|
|
`kube-node` 是集群中承载应用的节点,前置条件需要先部署好`kube-master`节点(因为需要操作`用户角色绑定`、`批准kubelet TLS 证书请求`等),它需要部署如下组件:
|
2017-12-06 11:17:27 +08:00
|
|
|
|
|
2017-12-14 19:42:20 +08:00
|
|
|
|
+ docker:运行容器
|
2018-01-05 23:05:22 +08:00
|
|
|
|
+ calico: 配置容器网络 (或者 flannel)
|
|
|
|
|
+ kubelet: kube-node上最主要的组件
|
2017-12-14 19:42:20 +08:00
|
|
|
|
+ kube-proxy: 发布应用服务与负载均衡
|
2017-12-06 11:17:27 +08:00
|
|
|
|
|
|
|
|
|
``` bash
|
|
|
|
|
roles/kube-node
|
|
|
|
|
├── tasks
|
|
|
|
|
│ └── main.yml
|
|
|
|
|
└── templates
|
2018-01-05 23:05:22 +08:00
|
|
|
|
├── cni-default.conf.j2
|
2017-12-06 11:17:27 +08:00
|
|
|
|
├── kubelet.service.j2
|
|
|
|
|
└── kube-proxy.service.j2
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
请在另外窗口打开[roles/kube-node/tasks/main.yml](../roles/kube-node/tasks/main.yml) 文件,对照看以下讲解内容。
|
|
|
|
|
|
|
|
|
|
### 创建角色绑定
|
|
|
|
|
|
2018-03-18 18:25:38 +08:00
|
|
|
|
kubelet 启动时向 kube-apiserver 发送 TLS bootstrapping 请求,需要先将 bootstrap token 文件中的 kubelet-bootstrap 用户赋予 system:node-bootstrapper 角色,然后 kubelet 才有权限创建认证请求,增加判断是否已经角色绑定。
|
2017-12-06 11:17:27 +08:00
|
|
|
|
|
|
|
|
|
### 创建 bootstrapping kubeconfig 文件
|
|
|
|
|
|
2018-03-18 18:25:38 +08:00
|
|
|
|
该步骤已经在 deploy节点完成,[roles/deploy/tasks/main.yml](../roles/deploy/tasks/main.yml)
|
|
|
|
|
|
2017-12-06 11:17:27 +08:00
|
|
|
|
+ 注意 kubelet bootstrapping认证时是靠 token的,后续由 `master`为其生成证书和私钥
|
|
|
|
|
+ 以上生成的bootstrap.kubeconfig配置文件需要移动到/etc/kubernetes/目录下,后续在kubelet启动参数中指定该目录下的 bootstrap.kubeconfig
|
|
|
|
|
|
2018-01-05 23:05:22 +08:00
|
|
|
|
### 创建cni 基础网络插件配置文件
|
|
|
|
|
|
|
|
|
|
因为后续需要用 `DaemonSet Pod`方式运行k8s网络插件,所以kubelet.server服务必须开启cni相关参数,并且提供cni网络配置文件
|
|
|
|
|
|
2017-12-06 11:17:27 +08:00
|
|
|
|
### 创建 kubelet 的服务文件
|
|
|
|
|
|
|
|
|
|
+ 必须先创建工作目录 `/var/lib/kubelet`
|
|
|
|
|
|
|
|
|
|
``` bash
|
|
|
|
|
[Unit]
|
|
|
|
|
Description=Kubernetes Kubelet
|
|
|
|
|
Documentation=https://github.com/GoogleCloudPlatform/kubernetes
|
|
|
|
|
After=docker.service
|
|
|
|
|
Requires=docker.service
|
|
|
|
|
|
|
|
|
|
[Service]
|
|
|
|
|
WorkingDirectory=/var/lib/kubelet
|
|
|
|
|
#--pod-infra-container-image=registry.access.redhat.com/rhel7/pod-infrastructure:latest
|
|
|
|
|
ExecStart={{ bin_dir }}/kubelet \
|
2018-06-09 22:19:20 +08:00
|
|
|
|
--address={{ inventory_hostname }} \
|
|
|
|
|
--hostname-override={{ inventory_hostname }} \
|
2018-05-19 23:56:54 +08:00
|
|
|
|
--pod-infra-container-image=mirrorgooglecontainers/pause-amd64:3.1 \
|
2017-12-06 11:17:27 +08:00
|
|
|
|
--experimental-bootstrap-kubeconfig=/etc/kubernetes/bootstrap.kubeconfig \
|
|
|
|
|
--kubeconfig=/etc/kubernetes/kubelet.kubeconfig \
|
|
|
|
|
--cert-dir={{ ca_dir }} \
|
2018-05-19 23:56:54 +08:00
|
|
|
|
--client-ca-file={{ ca_dir }}/ca.pem \
|
2017-12-06 11:17:27 +08:00
|
|
|
|
--network-plugin=cni \
|
|
|
|
|
--cni-conf-dir=/etc/cni/net.d \
|
|
|
|
|
--cni-bin-dir={{ bin_dir }} \
|
|
|
|
|
--cluster-dns={{ CLUSTER_DNS_SVC_IP }} \
|
|
|
|
|
--cluster-domain={{ CLUSTER_DNS_DOMAIN }} \
|
|
|
|
|
--hairpin-mode hairpin-veth \
|
|
|
|
|
--allow-privileged=true \
|
|
|
|
|
--fail-swap-on=false \
|
2018-05-19 23:56:54 +08:00
|
|
|
|
--anonymous-auth=false \
|
2017-12-06 11:17:27 +08:00
|
|
|
|
--logtostderr=true \
|
|
|
|
|
--v=2
|
|
|
|
|
#kubelet cAdvisor 默认在所有接口监听 4194 端口的请求, 以下iptables限制内网访问
|
|
|
|
|
ExecStartPost=/sbin/iptables -A INPUT -s 10.0.0.0/8 -p tcp --dport 4194 -j ACCEPT
|
|
|
|
|
ExecStartPost=/sbin/iptables -A INPUT -s 172.16.0.0/12 -p tcp --dport 4194 -j ACCEPT
|
|
|
|
|
ExecStartPost=/sbin/iptables -A INPUT -s 192.168.0.0/16 -p tcp --dport 4194 -j ACCEPT
|
|
|
|
|
ExecStartPost=/sbin/iptables -A INPUT -p tcp --dport 4194 -j DROP
|
|
|
|
|
Restart=on-failure
|
|
|
|
|
RestartSec=5
|
|
|
|
|
|
|
|
|
|
[Install]
|
|
|
|
|
WantedBy=multi-user.target
|
|
|
|
|
```
|
2018-03-18 18:25:38 +08:00
|
|
|
|
+ --pod-infra-container-image 指定`基础容器`(负责创建Pod 内部共享的网络、文件系统等)镜像,**K8S每一个运行的 POD里面必然包含这个基础容器**,如果它没有运行起来那么你的POD 肯定创建不了,kubelet日志里面会看到类似 ` FailedCreatePodSandBox` 错误,可用`docker images` 查看节点是否已经下载到该镜像
|
2017-12-06 11:17:27 +08:00
|
|
|
|
+ --experimental-bootstrap-kubeconfig 指向 bootstrap kubeconfig 文件,kubelet 使用该文件中的用户名和 token 向 kube-apiserver 发送 TLS Bootstrapping 请求
|
|
|
|
|
+ --cluster-dns 指定 kubedns 的 Service IP(可以先分配,后续创建 kubedns 服务时指定该 IP),--cluster-domain 指定域名后缀,这两个参数同时指定后才会生效;
|
|
|
|
|
+ --network-plugin=cni --cni-conf-dir=/etc/cni/net.d --cni-bin-dir={{ bin_dir }} 为使用cni 网络,并调用calico管理网络所需的配置
|
2018-05-19 23:56:54 +08:00
|
|
|
|
+ --fail-swap-on=false K8S 1.8+需显示禁用这个,否则服务不能启动
|
|
|
|
|
+ --client-ca-file={{ ca_dir }}/ca.pem 和 --anonymous-auth=false 关闭kubelet的匿名访问,详见[匿名访问漏洞说明](mixes/01.fix_kubelet_annoymous_access.md)
|
2017-12-06 11:17:27 +08:00
|
|
|
|
|
|
|
|
|
### 创建 kube-proxy kubeconfig 文件
|
|
|
|
|
|
2018-03-18 18:25:38 +08:00
|
|
|
|
该步骤已经在 deploy节点完成,[roles/deploy/tasks/main.yml](../roles/deploy/tasks/main.yml)
|
|
|
|
|
|
2017-12-06 11:17:27 +08:00
|
|
|
|
+ 生成的kube-proxy.kubeconfig 配置文件需要移动到/etc/kubernetes/目录,后续kube-proxy服务启动参数里面需要指定
|
|
|
|
|
|
|
|
|
|
### 创建 kube-proxy服务文件
|
|
|
|
|
|
|
|
|
|
``` bash
|
|
|
|
|
[Unit]
|
|
|
|
|
Description=Kubernetes Kube-Proxy Server
|
|
|
|
|
Documentation=https://github.com/GoogleCloudPlatform/kubernetes
|
|
|
|
|
After=network.target
|
|
|
|
|
|
|
|
|
|
[Service]
|
|
|
|
|
WorkingDirectory=/var/lib/kube-proxy
|
|
|
|
|
ExecStart={{ bin_dir }}/kube-proxy \
|
2018-06-09 22:19:20 +08:00
|
|
|
|
--bind-address={{ inventory_hostname }} \
|
|
|
|
|
--hostname-override={{ inventory_hostname }} \
|
2017-12-06 11:17:27 +08:00
|
|
|
|
--kubeconfig=/etc/kubernetes/kube-proxy.kubeconfig \
|
|
|
|
|
--logtostderr=true \
|
|
|
|
|
--v=2
|
|
|
|
|
Restart=on-failure
|
|
|
|
|
RestartSec=5
|
|
|
|
|
LimitNOFILE=65536
|
|
|
|
|
|
|
|
|
|
[Install]
|
|
|
|
|
WantedBy=multi-user.target
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
+ --hostname-override 参数值必须与 kubelet 的值一致,否则 kube-proxy 启动后会找不到该 Node,从而不会创建任何 iptables 规则
|
|
|
|
|
+ 特别注意:kube-proxy 根据 --cluster-cidr 判断集群内部和外部流量,指定 --cluster-cidr 或 --masquerade-all 选项后 kube-proxy 才会对访问 Service IP 的请求做 SNAT;但是这个特性与calico 实现 network policy冲突,所以如果要用 network policy,这两个选项都不要指定。
|
|
|
|
|
|
2018-03-18 18:25:38 +08:00
|
|
|
|
### 批准kubelet 的 TLS 证书请求
|
|
|
|
|
|
|
|
|
|
``` bash
|
|
|
|
|
sleep 15 && {{ bin_dir }}/kubectl get csr|grep 'Pending' | awk 'NR>0{print $1}'| xargs {{ bin_dir }}/kubectl certificate approve
|
|
|
|
|
```
|
|
|
|
|
+ 增加15秒延时等待kubelet启动
|
|
|
|
|
+ `kubectl get csr |grep 'Pending'` 找出待批准的 TLS请求
|
|
|
|
|
+ `kubectl certificate approve` 批准请求
|
|
|
|
|
|
2017-12-07 23:02:58 +08:00
|
|
|
|
### 验证 node 状态
|
|
|
|
|
|
|
|
|
|
``` bash
|
|
|
|
|
systemctl status kubelet # 查看状态
|
|
|
|
|
systemctl status kube-proxy
|
|
|
|
|
journalctl -u kubelet # 查看日志
|
|
|
|
|
journalctl -u kube-proxy
|
|
|
|
|
```
|
|
|
|
|
运行 `kubectl get node` 可以看到类似
|
|
|
|
|
|
|
|
|
|
``` bash
|
|
|
|
|
NAME STATUS ROLES AGE VERSION
|
2018-01-05 23:05:22 +08:00
|
|
|
|
192.168.1.42 Ready <none> 2d v1.9.0
|
|
|
|
|
192.168.1.43 Ready <none> 2d v1.9.0
|
|
|
|
|
192.168.1.44 Ready <none> 2d v1.9.0
|
2017-12-07 23:02:58 +08:00
|
|
|
|
```
|
2017-12-18 17:35:51 +08:00
|
|
|
|
|
|
|
|
|
|
2018-06-23 12:42:02 +08:00
|
|
|
|
[前一篇](04-安装kube-master节点.md) -- [后一篇](06-安装网络组件.md)
|