监控(Monitoring):是以系统可用性为中心,收集、分析和使用明确的信息来观察一段时间内的运行进度,并且进行相应的决策管理的过程。可观测性(Observability):基于白盒化的思路,通过分析系统生成的数据,构建完整的观测模型,理解推演出系统内部的状态。
背景:XX市新型冠状病毒肺炎疫情防控工作领导小组办公室下发《关于我市持续巩固疫情防控成果有序复工复产的实施方案》,明确XX全面复工复产时间点和任务安排,XX大数据中心要求防疫相关的扫码等服务系统务必保证稳定性,支撑XX人民有序复工复产。痛点:ISV厂商众多,缺乏全局视角,快速定界厂商问题。业务链路复杂,出现故障后定位问题困难,缺乏全链路可观测视角。故障频发,被动响应,缺乏体系化故障梳理。时间紧、客户”因为看见,所以相信”,同时需求变动频繁。