资源与服务一体化的监控告警平台,面向多云服务、现代应用,以ITIL流程为基础,以AIOps为驱动集监控、告警、自动化运维、故障自愈于一体。资源与服务全方位的监控和告警,让您的资源安全无忧。
系统自带数十个不同系统的仪表盘。支持创建新仪表盘,灵活调整监控数据展示内容。仪表盘支持分享模式,其他用户也可以使用。共享仪表盘可以用于云组件的监控配置,并用于在云资源详情的监控数据展示。
监控状态图:总览资源性能与健康状态,帮助快速定位有问题的云资源。云资源监控大屏:任意云资源的监控状态。云资源详情的监控,云平台的资源信息。
从不同的数据源中聚合数据,转交给告警引擎;引擎根据告警策略中设置的告警条件,对某一固定时间窗口内,对数值进行检查。基于指标的报警:阈值告警、预测告警。宕机报警:Linux、Windows、软件等。根据定义的告警,判定数值是否触发警报,并进行相应通知及操作。
平台支持对接第三方监控系统,采集第三方系统的告警信息,实现告警的统一处理。主要支持如下几种对接方式:通过SNMP Agent集成,如vSphere,SNMP监控网络等。通过webhook集成,如阿里云,AWS,Azure,腾讯云,Zabbix,Prometheus等。通过第三方系统集成,支持Airflow,Camel等。对平台纳管的云资源,支持将告警和相关资源进行智能关联。