icon今天,企业客户上云后的监控面临巨大挑战icon
资源规模和复杂度
资源规模越来越大
资源越来越多样化
资源如何分组分权管理?
多账号如何统一?
海量资源如何优化?
混合云多云趋势明显
云上云下如何打通?
云上到云下需求
云下到云上需求
多云如何统一?
一体化监控需求
基础监控
应用可用性
应用性能
业务指标
icon云监控 满足不同层次客户需求:基础版&企业版icon
基础版
主机监控
负载、磁盘、网络、进程
云产品监控
计算、存储、网络、数据库、中间件...
容器监控
集群、节点、命名空间、应用、POD
应用分组
资源组、TAG、名称规则
报警
动态阈值、组合条件、模板、黑名单、升级、排班
企业版
企业监控大盘
多云混合云、多账号、跨产品跨地域跨集群、分业务
资源水位报告
整体视角、业务视角
务监控
应用Prometheus指标、SLS日志、本地日志、自定义指标
实时数据导出
icon云监控功能大图icon
icon跨账号多云混合云监控方案icon

客户痛点:中心运维团队需要监控和分析云资源的运行状况,资源分布在多个账号下,增加了数据集中收集的成本,增加了故障排查和解决问题的时间。企业由IDC搬到云环境,运维团队需要兼顾IDC资源,云上资源的监控。增加了维护成本。对于多云企业,运维团队希望能够有一个统一的监控报警控制台,减化多云监控负担。

解决方案 资源目录与云监控集成推出企业级云监控方案,一次配置,即可在一个地方集中地查看组织内不同账号的监控指标数据,而无需登录切换不同的账号。通过跟客户线下,其他云厂商数据集成,云监控支持报警和数据集成。
客户价值 集中化地管理企业内多账号的监控任务,提升管理效率,缩短平均问题解决时间。通过一套监控系统可以做到混合云/多云的资源统一管理,提升运维效率。
回关联云产品 云监控、资源目录(RD )
使用场景 跨账号,适用于多账号企业进行资源的统一监控。混合云,可以利用云监控实现云上/云下一体化监控。多云,基于云监控打通企业多个云服务监控数据,实现集中监控。
icon大规模资源分组分权管理icon

一种资源分组管理的机制,解决单个阿里云账号内的资源分组和授权管理的复杂性问题。

主账号
创建资源组并基于资源组生成应用分组,给子账号授权资源组权限
子账号
在分组中,查询图表,创建图表,查看和管理组内报警
监控视图
通过企业监控大盘查看资源组维度的监控数据
资源水位分析
助资源水位报表对资源组维度的数据进行分析
icon大规模资源监控的最佳实践 基于云监控应用分组的规模资源监控方案icon
icon云资源负载水位分析icon
客户场景

分析资源负载,识别低负载和高负载的实例,用于资源释放,资源成本消耗,统计大促期间资源水位,用于未来再次大促时,资源购买的依据。云管或运维同学,每周统计资源负载情况,向上汇报。

客户痛点

资源种类多,资源数量多,多账号分布等拉取数据困难。多维度的统计分析,需要数据统计分析能力,甚至一些智能化算法的支持。

解决方案

资源水位报表:每个资源的最大最小平均P90P95的。资源水位报告:即提供高维度的统计,如总负载,总资源数量,的趋势,如按资源提供业界标准的负载水位情况。资源优化推荐:通过智能化算法,提供给客户最优的配置,以及预估的可减少的费用情况。

icon网络分析与监控icon

能力介绍:借助全球网络探测节点,对目标域名/Ip进行模拟拨测,监控目标地址在不同地域、运营商网络环境下访问的网络时延、可用性情况,并支持配置告警。全球200+纯自建、高稳定探测节点,秒级间隔实时拨测目标域名/ip,快速发现服务可用性、网络质量、域名解析异常等问题。

产品能力
全球探测节点:自建200+全球探测节点,覆盖中国境内三大运营商省会城市及aws、google、azure等云厂商海外数据中心所在主要城市地区。多种拨测协议:支持Http(s)、Ping、Tcp、Udp、Dns、Smtp、Pop3、Ftp、Trace等丰富的探测协议,覆盖日常业务运维的协议拨测需求。秒级拨测监控:支持设置秒级主动拨测监控,帮助客户更快发现问题。灵活配置告警:灵活的自定义告警规则,当拨测监控到问题时发出告警。监控详情分析:对拨测监控结果数据可从不同地域运营商按网络时延、可用性、丢包率等指标综合分析,支持对多个监控目标进行对比分析。运营商DNS拨测:使用运营商公共DNS拨测,准确发现域名劫持、污染问题。
典型场景
服务可用监控:线上服务的可用性是互联网业务开展的先决条件。使用本服务配置http(s)拨测任务从全球不同地域运营商模拟访问域名地址,对服务的全球可用性进行持续监控及预警,第一时间发现服务可用性风险。域名解析监控:域名能否在互联网被正确解析,将直接影响线上业务能否正常开展,企业对重点域名有解析监控需求。使用本服务配置DNS拨测任务,获得域名在不同地域网络下的解析结果,判断是否出现解析异常。网络质量监控:网络质量的好坏密切影响着互联网云上业务提供服务体验的好坏。使用本服务配置Ping拨测任务,观察不同地域运营商到目标地址的网络质量情况时延、丢包率等情况,帮助分析网络质量、制定网络优化策略。
icon内外网络可用性方案icon
阿里云监控的站点监控优势
✓ 稳定性优势,云监控探测点稳定可靠。
✓ 实时性强,支持秒级探测。
✓ 全国省级运营商全覆盖,海外各大洲十几个主要国家布点。一键创建几百个省市的探测点任务。
✓ 全面的探测协议,站点监控支持 http(s),ping, dns, tcp,udp,ftp, smtp,pop3,等8种以上的探测协议。
✓ 多维度的报表展示和问题排查,详细的延迟数据分析。
✓ 支持与云服务联动,如报警时,报警消息发送到sls,mns,函数计算等。
✓ 全面的通知渠道,支持邮件,钉钉,短信,电话,以及自定义的http webhook。
icon基础&应用&业务监控一体化icon
icon总结icon
产品推荐 查看更多>>
    云智慧 数字化运维基础设施监控DOIM

    云智慧新一代数字化基础设施监控(Digital Operation Infrastructure Monitoring)对IT基础设施实现监、管、控⼀体化的监控运维管理,是基于云架构的基础设施监控平台,具有良好的扩展性、管理性、稳定性,可以随着企业的扩大、监测内容的增多而无缝扩展,自动化地管理、展示、预警及告警。

    高效稳定

    安全可靠

    功能完备

    壹合原码智能化楼宇自控施工系统

    壹合原码智能化楼宇自控施工系统,基于多年沉淀的深度学习技术及强大的专家团队,针对多个工业垂类场景进行算法优化,打造最优的工业AI算法模型,提供更加精准的工业AI模型库,客户可直接选择适合自己业务场景的模型,快速实现业务落地 。

    人工智能AI

    无人值守智能巡检

    全感知设备接入

    工业AI算法

    华为云应用管理与运维平台 ServiceStage

    ServiceStage是面向企业的应用管理与运维平台,提供应用开发、构建、发布、监控及运维等一站式解决方案

    丰富场景

    高效稳定

    安全可靠