稳定性是安可的基石。技术的发展更新、业务的创新实践、系统的敏捷迭代,对保持系统稳定带来巨大挑战。技术团队的组织、职责、流程需要全局拉通定义。
是一种实验方法,本质是期望从故障中受益,通过实验主动挖掘系统缺陷。通过主动向目标系统注入故障、评价实时稳态(SLI)变化,来暴露未知风险。使需要长期运行、典型场景才爆发的问题,提前暴露。推进系统面向失败的设计。
云泰基于混沌工程理论,为全栈系统提供稳定性攻防验证能力,通过主动注入故障、评价系统表现有效挖掘未知风险、验证系统抗风险能力,使稳定性治理由被动变主动。
n 典型金融创新数字底座(一云多芯+云原生平台+国产化中间件)、敏捷迭代的金融业务场景。风险:基础设施异构、链路调用长、各层面组件故障对全局的影响难以界定。目标:验证国产化替代后,在稳定性方面的水平,主动进行前置的风险挖掘和暴露。
在技术选型中,验证云平台IaaS层高可用能力。即底层故障时,具备故障自恢复能力,不影响业务。验证待选型的底座,对业务的适配性、兼容性、性能表现。