B站故障演练平台实践
出处:
mp.weixin.qq.com
作者:
黄焱&王旭
在云原生的架构下,微服务的数量呈现爆炸式增长,服务间的调用关系错综复杂,对系统可靠性也提出了更高的要求。在这样的背景之下,混沌工程的关注度也不断提升。 事实上,混沌工程早就不是什么新鲜的概念,早在2008年开始,混沌工程的思想就已经始萌芽,彼时,网飞公司由于数据库发生故障,导致了三天时间的停机,使得 DVD 在线租赁业务中断,造成了巨大的经济损失,正是这次线上事故推动了后续的 ChaosMonkeyV1 项目的诞生。在那之后,类似于 SimianArmy、ChaosKong、Gremlin、ChaosMonkeyV2、ChaosBlade、ChaosMesh、ChaosMeta 等混沌工程相关产品在各个大公司的实践中走入公众视野。