简介

在《SRE: Google 运维解密》一书中指出,监控系统需要能够有效的支持白盒监控黑盒监控:

  • 通过白盒监控能够了解其内部的实际运行状态,通过对监控指标的观察能够预判可能出现的问题,从而对潜在的不确定因素进行优化。

  • 通过黑盒监控(常见的如 HTTP 探针,TCP 探针等),可以在系统或者服务在发生故障时能够快速通知相关的人员进行处理。

最后更新于