云规模提升,云上不可预测、不可控、复杂性高等特性导致故障频发,造成安全事故和经济损失。
混沌演练平台(Chaotic Fault Generator)提供高效便捷、安全可靠的故障演习服务,除可视化故障注入服务外,还提供行业经验模板,监控护栏等核心功能,致力于帮助用户及时发现务容灾隐患、验证高可用预案的有效性,实现稳定运营。
混沌演练平台提供IaaS 到 Paas各类故障注入场景,包含近 200 种故障原子能力,支持灵活编排组合。支持用户自定义故障动作脚本,满足业务定制化需求。
满足混沌GameDay设计要素,帮助组织者快速组织混沌演练。
平台提供电商、游戏、多媒体等多个行业的演练经验模板,覆盖跨可用区容灾等多个典型应用场景。用户可根据自身业务需求,快速高效复用成熟解决方案,提高演练效率。
查看实例资源分布可视化视图,降低操作成本,精准控制爆炸半径。故障动作可视化编排,演练中实时查看故障动作执行状态(成功/失败/执行中)和注入效果。
为保障业务的演练安全,混沌演练平台提供多项安全防护策略:权限管控:接入了cam鉴权,所有操作对象实例均基于当前帐号的被授权范围,确保不会发生越权操作。故障恢复:所有故障动作均对应相应的回滚动作,即使回滚失败,也有相应的人工处理预案作为兜底。监控护栏:演练中实时查看业务稳态指标曲线,监测业务健康状态,护栏规则触发后演练自动停止。
平台提供完备的可视化演练报告,内容包括演练基本信息/数据统计/实例资源分布图和演练日志等。一键导出演练报告,复盘记录问题,打造演练全生命周期闭环。