云监控 Barad 的云原生实践
出处:
mp.weixin.qq.com
作者:
赵轩
在降本增效的大背景下,腾讯云 云监控团队继续提升云原生成熟度,提升系统承载能力和降低单位成本,包括对 Barad 业务在容器化占比提升,跨 az 容灾能力建设,资源利用率优化这些方面,因 Barad 业务量级庞大,如何保障大量级数据的稳定处理以及单位成本的优化,这里都有着不小的挑战: 底层设备量级大,整体上云后并发,时延,稳定性保障 系统架构复杂,底层模块和旁路功能涉及 40+,迁移这类能力时的稳定性保障 海量上报数据实时计算,准确性和实时性的保障 业务迁移场景时告警时效性和可触达性的保障 大数据处理相关模块迁移上云的性能稳定性保障 接入业务多,适配场景众多,控制台使用稳定性保障 监控数据存储量级大,存储迁移的查询稳定性保障