如何用 SkyWalking 和 eBPF 实现持续性能分析
出处:
mp.weixin.qq.com
作者:
刘晗
在之前的文章中,我们讨论了如何使用 SkyWalking 和 eBPF 来检测性能问题,包括进程 [1] 和 网络 [2]。这些方法可以很好地定位问题,但仍然存在一些挑战: 1. 任务启动的时间: 当需要进行性能监控时,解决需要性能监控的进程始终是一个挑战。通常需要手动参与,以标识进程和所需的性能分析类型,这会在崩溃恢复期间耗费额外的时间。根本原因定位和崩溃恢复时间有时会发生冲突。在实际情况中,重新启动可能是恢复的第一选择,同时也会破坏崩溃的现场。 2. 任务的资源消耗: 确定分析范围的困难。过宽的分析范围会导致需要更多的资源。我们需要一种方法来管理资源消耗并了解哪些进程需要性能分析。 3. 工程师能力: 通常由整个团队负责呼叫,其中有初级和高级工程师,即使是高级工程师也对复杂的分布式系统有其理解限制,单个人几乎无法理解整个系统。 持续剖析(Continuous Profiling) 是解决上述问题的新机制。