GitHub最火开源监控系统Prometheus,我却发现了它的一个Bug(feature)?
出处:
mp.weixin.qq.com
作者:
腾讯云开发者
Prometheus 受启发于 Google 的 Borgmon 监控系统,从 2012 年开始由前 Google 工程师在 Soundcloud 以开源软件的形式进行研发,并且于 2015 年对外发布早期版本。2016年5月继 Kubernetes 之后成为第二个正式加入 CNCF 基金会的项目,2018年8月9日,云原生计算基金会(CNCF)宣布开放源代码监控工具 Prometheus 已从孵化状态进入毕业状态,标志着 Prometheus 已经具备稳定性和成熟度,而且得到了市场的认可,已经成为了云原生中指标监控的事实标准。目前在 GitHub 已有超过 53.1k star。 然而在实际的使用场景中,我们会经常发现 Prometheus 存在指标值不准的“怪现象”,这么完美的主流监控方案,为何会存在这样的问题,究竟是 Bug 还是 Feature?本文将通过典型案例详细拆解、探讨其背后的设计原理。