IStorM Chaos是一套完整的混沌工程体系化实践工具平台,提供成熟的实践场景和丰富的故障注入手段,通过对业务系统进行平台、中间件、应用等维度的故障注入实验,并提供提供自动化、智能化的混沌实验和体检套餐,帮助技术团队发现更多未知的业务稳定性隐患,有效的提升业务和系统稳定性。
丰富的可扩展的故障库,除提供所有基础的,基本上涵盖基础资源、平台、中间件、应用。除了所有的已知故障外,还支持快速自定义来扩展故障库。
混沌工程实验的故障注入对象是分布式应用,通过实验的方式提升分布式应用的稳定性。将应用接入到IStorM Chaos混沌工程平台后,可 通过平台安装故障注入介质,获取应用的信息,下发故障,完成混沌实验,从整体应用的维度分析稳定性。
智能推荐实验场景,生成体检套餐;可以自定义应用、平台、基础设施、组件等维度配置标准检查项目;针对检查对象,自动按照套餐中的检查项目开展混沌实验,快速得出体检结论;统计视图可以纵向分析应用技术风险隐患,横向比对或排查故障影响范围。
基于工作流引擎的场景编排,支持并行,串行的组合,支持实验计划的手动执行、定时及周期执行、随机自动执行的流程定义,演练过程 灵活可控,可随时终止演练。
事前:对爆炸半径进行控制到应用级别、支持构建网络沙箱,控制流量半径、支持对数据的备份保护、支持云原生生产沙盘实验;事中:支持基于指标基线、告警基线、特征基线的智能化终止保护、支持一键终止保护;事后:自动化故障自愈以及环境恢复、基于应急预案的事后处置;管理:基于项目维度的人员操作和数据权限管理,以及流程审批,审计日志等,确保实验全程可管理。
由内置原子故障智能推荐关联观测指标,也支持自定义指标添加;稳态基线验证故障执行指标及实验结果是否符合预期,以及对实验进行防护。
可扩展指标库:支持Promethus、Zabbix、Influxdb等;场景编排可视化:拖拉拽的可视化编排场景,以及参数配置;注入流程可视化:故障节点执行状态全程可视(完成、实验中、失败等)、过程全程可视(注入状态、生效状态、恢复状态、 稳态判断)、日志展示(开始、结束、失败原因等);可视化的实验观测面板、可视化的实验结果、可视化根因分析。
该机构在进行新核心系统改造,微服务化,容器化,云原生化的过程中发现:如何在上生产前验证平台以及应用的稳定性?需寻找 一种机制确保在 IT 架构转型过程中所有业务可以稳定对外提供服务。 根据信通院发表的云原生构建的业务应用的能力成熟度评估模型,从基础平台、应用研发域、服务治理域等方面评估该银行云原生 业务应用在弹性、高可用、自愈性、可观测性以及自动化等方面的云原生能力成熟度。
第一阶段,通过对集中交易系统研发、运维体系调研,规划、设计并输出混沌工程技术平台和工作流程体系,保障技术平台和系统具备CO2+ (分布式系统稳定性评估)能力要求,加速数字化转型。 第二阶段,建设混沌工程平台,构建实验场景库,投产前通过混沌实验验证研发架构、技术框架策略有效性,为应用研发提供框架可靠性支撑; 投产后,运维团队通过混沌工程,模拟基础设施和业务操作实验,贴近运维故障关注点和预案防范点,提高运维监控、应急响应能力。
Bonree Server通过业务拓扑、应用拓扑清晰展现逻辑关系,概览系统全局。全面实时获取服务端性能数据,通过应用、组件、集群、容器及代码等逐层深入分析,最终从代码层和环境层帮助企业定位分析自身服务端性能问题。
高效稳定
安全可靠
云监控(Cloud Monitor Service)为用户提供了一个针对浪潮云资源全方位监控的平台,您无需额外开发工作,即可全面掌控云上的资源使用情况、业务的运行状况。
安全可靠
使用便捷
百度智能云工业智能安防监控方案,全面的行业化AI技能,通过双向IoT通道快速下发和更新模型,快速灵活的部署新的能力真正做到符合自身生产状况的高效管理。
应急管理监控大屏
人脸识别准入
离线识别SDK
车牌信息核验