kubernetes-guide/content/basics/monitoring/grafana/ha-setup.md

121 lines
4.5 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters!

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

# Grafana 高可用部署
## 概述
Grafana 默认安装是单副本,非高可用部署,而 Grafana 自身是支持多副本高可用部署的,本文介绍其配置方法以及已经安装的 Grafana 如何迁移到高可用架构。
## 修改配置
要让 Grafana 支持高可用,需要对 Grafana 配置文件 (`grafana.ini`) 进行一些关键的修改:
1. Grafana 默认使用 sqlite3 文件存储数据,多副本共享可能会有数据冲突,可以配置一下 `database` 让多副本共享同一个 mysql 或 postgres 数据库,这样多副本就可以无状态横向伸缩。
2. Grafana 多副本运行,如果配置了告警规则,每个副本都会重复告警,配置一下 `ha_peers` 让 Grafana 自行选主只让其中一个副本执行告警。
```ini
[database]
url = mysql://root:123456@mysql.db.svc.cluster.local:3306/grafana
[unified_alerting]
enabled = true
ha_peers = monitoring-grafana-headless.svc.monitoring.cluster.local:9094
[alerting]
enabled = false
```
* `database` 下配置数据库连接信息,包含数据库类型、用户名、密码、数据库地址、端口以及要具体哪个库。
* `alerting``enabled` 置为 false表示禁用默认的告警方式(每个 Grafana 实例都单独告警)。
* `unified_alerting``enabled` 置为 true表示开启高可用告警。
* `unified_alerting``ha_peers` 填入 Grafana 所有实例的地址,在 k8s 环境可用 headless servicedns 会自动解析到所有 pod ip 来实现自动发现 Grafana 所有 IP端口默认是 9094用于 gossip 协议实现高可用。
## helm chart 配置示例
如果 grafana 安装到 Kubernetes通常使用 helm chart 来安装,一般是 [grafana 官方 chart](https://github.com/grafana/helm-charts/tree/main/charts/grafana)`values.yaml` 配置示例:
```yaml
replicas: 2
defaultDashboardsTimezone: browser
grafana.ini:
unified_alerting:
enabled: true
ha_peers: 'monitoring-grafana-headless.monitoring.svc.cluster.local:9094'
alerting:
enabled: false
database:
url: 'mysql://root:123456@mysql.db.svc.cluster.local:3306/grafana'
server:
root_url: "https://grafana.imroc.cc"
paths:
data: /var/lib/grafana/
logs: /var/log/grafana
plugins: /var/lib/grafana/plugins
provisioning: /etc/grafana/provisioning
analytics:
check_for_updates: true
log:
mode: console
grafana_net:
url: https://grafana.net
```
* `grafana.ini` 字段用于修改 grafana 配置文件内容,使用 `yaml` 格式定义,会自动转成 `ini`
* `ha_peers` 指向的 headless service 自行提前创建(当前 chart 内置的 headless 没暴露 9094 端口)。
headless service 示例:
```yaml
apiVersion: v1
kind: Service
metadata:
name: monitoring-grafana-headless
namespace: monitoring
spec:
clusterIP: None
ports:
- name: http-web
port: 3000
protocol: TCP
targetPort: 3000
- name: alert
port: 9094
protocol: TCP
targetPort: 9094
selector:
app.kubernetes.io/instance: monitoring
app.kubernetes.io/name: grafana
type: ClusterIP
```
如果你使用的 [kube-prometheus-stack](https://github.com/prometheus-community/helm-charts/tree/main/charts/kube-prometheus-stack) 安装,实际也是用的 Grafana 官方的 chart只不过作为了一个子 chart`values.yaml` 时将上面准备的配置放到 `grafana` 字段下面即可:
```yaml
grafana:
replicas: 2
defaultDashboardsTimezone: browser
grafana.ini:
...
```
## 已安装的 Grafana 如何迁移到高可用架构
如果你用的默认安装,使用 sqlite3 文件存储数据,可以先按照如下步骤迁移数据:
1. 拿到 `grafana.db` 文件,使用 Grafana 官方提供的迁移脚本 [sqlitedump.sh](https://github.com/grafana/database-migrator) 将 sqlite3 的数据转换成 sql 文件:
```bash
sqlitedump.sh grafana.db > grafana.sql
```
> 确保环境中安装了 sqlite3 命令。
2. 停止 Grafana (如果是 K8S 部署,可以修改副本数为 0)。
3. 准备好数据库,提前创建好 grafana database:
```sql
CREATE DATABASE grafana;
```
4. 替换 Grafana 配置文件,参考前面的配置示例。
5. 启动 Grafana让 Grafana 自动初始化数据库。
6. 将 sql 文件导入数据库执行:
```bash
mysql -h172.16.181.186 -P3306 -uroot -p123456 grafana < grafana.sql
```
7. 恢复 Grafana 运行。
## 参考资料
- [Set up Grafana for high availability](https://grafana.com/docs/grafana/latest/setup-grafana/set-up-for-high-availability/)