当代社会的生产和生活离不开巨大而复杂的软硬件系统。包括互联网、高性能计算、电信、金融、电力网络、物联网、医疗网络和设备、航空航天、军事设备和网络等。
这些系统的用户需要良好的用户体验。因此,这些复杂的系统,操作和运行需要专业维修人员来处理各种突发的事件,确保系统的可靠运行。因为各种突发事件都会产生大量的数据,从本质上讲,智能运维可以看作是大数据分析的具体应用场景。
智能操作和维护的范围是综合机器学习,软件工程,行业知识,操作和维护场景知识,智能化的操作和维护的顺利发展是离不开密切合作的。
由于大数据和人工智能,今天的操作和智能模式的维护开始阶段,越来越多的企业开始重视智能操作和维护。公司和组织可以采用集中监控平台收集系统的各种运行工作状态和执行逻辑信息,如网络流量、服务日志等等等来实现企业综合感知。运维数据随着系统规模的增长也在呈爆炸式的增长, 每天生产数千亿条监测数据和日志,给运维带来各种困难和挑战,促进智能运维技术的不断发展。
相较于手动运维,自动化运维极大地提升了运维的效率,DevOps提升了研发和运维的配合效率,然而当整个互联网系统的数据规模开始爆炸性增长和服务类型的复杂多样,基于人为指定规则的专家系统遇到了诸多瓶颈。其中很重要的一条是:对于长期从事某行业运行维护工作的专家来说,手工总结重复、可追溯的现象,形成规则,完成自动运行维护是非常必要的。然而,这种以规则为基础的人工方法并没有解决规模化经营和维护的问题。
与依赖人工生成规则的自动操作和维护不同,智能操作和维护强调机器学习相关算法从海量运维数据中自动完成学习(包括事件本身和运维人员需要人工处理系统日志),完善和总结规则,也就是说,智能运维在自动运维的基础上增加了一个基于机器学习的大脑,它命令监控管理系统信息采集大脑决策所需的数据,进行研究分析、决策,并命令自动脚本执行大脑决策,从而能够达到提高系统安全运行维护的总体设计目标。
高德纳报告预测,全球aiops的部署率将从2017年的10%提高到2020年的50%。
更多产品了解
欢迎扫码加入云巴巴企业数字化交流服务群
产品交流、问题咨询、专业测评
都在这里!
2022-11-22 09:52:44
2022-11-22 15:28:49
2022-11-24 10:43:50
甄选10000+数字化产品 为您免费使用
申请试用
评论列表