kubernetes-handbook/usecases/observability.md

1.9 KiB
Raw Blame History

可观察性

可观察性使用指标、日志和追踪这些外部输出来理解系统的能力。这些指标、日志和追踪是基于系统内部的事件产生的。

指标Metrics

指标是数据的总体汇总,它能让你了解正在发生的事情和需要深入挖掘的地方。服务不断产生消费指标,这些指标是服务健康状况的持续衡量标准。

指标包括两种类型:应用/业务指标和运维指标。

应用指标

应用性能指标Application Performance Metrics简称 APM数据与应用性能有关如加载时间和响应时间确保应用向客户提供预期性能。像 Apache SkyWalking 这样的开源技术可以集成到 Istio 服务网格中,既可以作为 APM也可以作为额外的服务性能管理Service Performance Management简称 SPM系统——一举两得。

运维指标

运维指标关注的是服务的运行情况。你的环境表现如何,通常被描述为 "RED "指标——衡量请求Request率 、错误Error率和持续Duration时间。

服务网格比如Istio唯一关心的就是收集这些运维指标帮助你确定服务表现如何并对服务健康状况有一个大致的了解。

日志Logs

日志是冗长的。包含一个 "事件"从头到尾的信息。一则日志可以收集(匿名)用户数据。例如,哪个用户发出了请求,这条请求从哪里开始,到达哪些服务等等。

追踪Tracing

追踪让你能够看到一个请求从开始到结束的过程。它是对事件行为的实时捕捉。它可以帮助确定故障发生的位置,或确定引起当前示例性能问题的原因。 在基于微服务的环境中会产生大量的事件。事件被定义为从请求到达网络外围的那一刻起发生的一切,即产生可观察数据的动作。