如何在架构升级过程中完成已有运维体系向新运维体系的平滑切换,及如何在新的云原生架构下继续保障和提升运维能力,
是当前银行运维所面临的挑战。
背景: 手机银行、网上银行、信用卡、超级柜台、柜面系统、扫描支付等数字终端是银行提供给用户进行交易的不同渠道,用户使用以上渠
道的体验好坏直接关乎银行客户群体的留存以及业务损失;
实现路径:听云可观测分析平台可实现银行对外业务系统的从用户侧到服务端、网络端、基础组件侧的全链路监测,实现故障的提前发现、
及时预警、故障快速定位,全面优化银行业务体验,提升企业品牌形象。
背景:行内高净值或重要的VIP客户是银行重点要保障用户体验的VIP客户,很多时候缺少有效手段实时感知用户体验,特别是当VIP用户体验较差
时会严重影响客户满意度。
实现路径:通过制定VIP用户告警策略,当VIP用户体验低于预警策略时发送告警,实现主动感知来避免投诉,抢在投诉前可进行用户关怀。
·背景:面对行内真实用户投诉时,用户的描述往往过于主观,研发及运维人员无法根据投诉内容精准定位用户异常问题。
·实现路径:通过用户标识能够快速检索该用户发生过的所有异常问题,了解每个异常问题的用户使用流程还原问题现场,从而精准定位异
常问题发生时间、异常问题类型及异常问题根因。
背景:传统银行存在“部门银行”现象,很多部门往往只看自己这一段流,从局部看,每一段流程都是最优的,但整个流程走下来,客户体验却不好。
·解决路径:统一平台数据协同,可视、交易特征等,实时通过智能化模型化平台,打破银行部门割裂,助推银行实现”以用户为中心”的数字化运营战略转型。通过用户旅程监测指标,银行可以根据用户属性精准筛选用户,在用户旅程的路径上进行精准推荐,针对特定行为特征显著的用户,例如用户大额资金转出,提供理财、生活服务等产品服务推荐,实现数字化运营留客、活客,通过用户旅程监测指标动态反映用户旅程过程。
背景:在金融信创背景下,截至2024年年初,鸿蒙生态设备数量已达8亿,已有数千个企业和机构启动了鸿蒙原生应用开发。由于鸿蒙应用属于
新语言、新系统、新框架,上线后存在很多不可预期的BUG,研发需要进行针对鸿蒙应用的异常管理;如何评估用户体验,用户感知情况是否有下降,缺少有效的手段;
·解决路径:基调听云HarmonyOS NEXT SDK采用非侵入式嵌码策略,利用HarmonyOS提供的系统特性和开发框架,实现对应用性能的监控。SDK在应用编译和运行时均不修改用户的业务代码,确保监控过程的透明性和用户代码的完整性。
背景:银行有比较完善的内网网络监控体系,但因为缺乏外网监控手段,对于内网外的真实用户访问无法感知。
实现路径:通过主动式拨测监控,实现先于真实用户发现影响用户体验的可用性和性能问题,从而覆盖最终用户到行内入口这段监控盲点。
背景:金融机构的网络安全面临多重威胁,传统防护措施可能无法应对大规模攻击或网络瓶颈。为了确保业务连续性,银行需要定期开展
模拟演练,验证防护措施在各种攻击场景下的有效性。
实现路径:在模拟演练中,银行借助运营商清洗服务或云服务等手段来应对潜在的网络威胁。听云Network在演练中发挥重要作用,帮助
银行实时监测和验证这些外部服务的响应能力,确保在实际威胁场景下,防护措施能够有效运行并迅速恢复
背景:各企业为响应工信部、网信办发布的《IPv6流量提升三年专项行动计划(2021-2023)》行动目标,在IPv6升级改造过程中,需要一套拨测系统及时了解自身IPv6的改造情况及性能劣化情况。
实现路径:听云Network监控为IPv6改造提供有效的三方视角支撑,很好地满足人行IPv6改造的性能监测、效果评估等要求。整体看IPv6更优,但整体外部IPv6环境还不稳定,偶发性出现IPv6路由问题,通过监测发现并告知运营商。
背景:手机银行等App的用户体验在行业内处在什么位置?通过对标评测,建立和完善用户体验指标体系,为优化和迭代App质量提供数据依据。
实现路径:通过部署在全国范围内的真实手机终端,提供真实网络环境下的评测服务,并根据测试数据提供前端用户体验的优化和改进建议。
背景:作为银行的重要业务,快捷支付能够增强银行在支付市场的竞争力,吸引更多客户并增加营收。然而,当快捷支付系统无法进行实时监控时,系统故障往往只能依赖客户反馈才能发现,如微信等渠道中的状态异常。这种滞后的故障发现机制严重影响了客户的支付体验。
实现路径:通过APP主动拨测业务,主动模拟“快捷支付”操作,实时监测业务的可用性和性能,第一时间发现系统问题,从而显著提升了客户体验和系统响应速度。
背景:手机银行交易级别链路,如转账链路、理财链路等为行内核心业务,当交易链路出现故障时,必须要在5分钟内发现及定位,交易业务特点为用户访问量大、业务量大、使用频繁、在传输过程中数据量比较大,容易产生延时、业务逻辑复杂,遍历节点多,节点之间协议复杂等特点
实现路径:通过交易全链路监控实现端到端的全节点覆盖,并实现单用户、单笔交易维度的追踪分析
事务追踪拓扑、代码调用栈、异常分析、SQL 分析/NoSQL分析、参数和上下文信息和数据项、智能分析、日志溯源
背景:银行在架构升级应用微服务化的过程中,建设了一部分监控,如使用Skywalking或基于OpenTelemetry协议自研探针来实现微服务监
控,但由于skwalking探针局限性及自研需要投入大量人力开发的情况,且Agent都是基于OpenTelemetry协议数据格式,在不浪费之前投
入且可要引入新的监控能力。
实现路径:使用听云可观测分析平台把Skywalking、Opentelemetry探针、听云Agent数据等其他第三方数据通过Opentelemetry标准接
入进来并做数据整合展现,实现多数据源的拓扑打通、链路打通。
背景:行内因为部署环境复杂多样(如大型机,x86服务器,容器等),核心系统:如二代支付系统、核心账务系统采用C语言开发,部署采用私有框架协议。
实现路径:基于C探针埋点+OneTrace+协议适配实现全链路追踪
私有协议系统
背景:在微服务的场景下,应用调用链极其复杂,同时也产生了包含详细业务数据的海量应用日志,全面发挥APM全链路追踪和海量日志处理能力的优势,在调用链中定位问题时,可结合日志中详细的业务上下文信息,高效精准定位问题。
实现路径:以用户访问链路为追踪,通过TracelD打通用户端、网络端、服务端,并与此次交易过程各应用节点日志数据进行关联分析。
背景:金融信创改造涉及硬件服务器变更、操作系统变更、应用及中间件变更、数据库变更等,问题点多且复杂,风险难以预估,排障及改造时间长,同时,银行对业务系统实时性、高效性、稳定性等具有较高要求,业务系统信创改造迁移可靠性保障和性能对比缺失,迁移质量及用户体验难以保障。
实现路径:建立端到端的用户体验保障、业务系统分析能力,保障系统稳定性、连续性以保障及提升用户体验
信创改造开发环节的质量保障、信创、非信创环境的性能对比、信创改造过程中的可靠性保障和上线评估、信创可视化、信创生产环境业务连续性保障和故障定界定位、监管报送场景、信创环境用户视角的体验评估和优化、基于信创系统监控指标的最佳实践
背景:新一代核心系统建设源于银行“以客户为中心”的业务快速创新和差异化需求。在云化和分布式IT技术架构的背景下,系统实例规
模大幅增长,运行状态指标日益复杂,导致运维的可观测性不足,难以及时定位和解决问题。传统的监控和应急手段难以有效支持分布式
架构下的故障快速定位和处置。
实现路径:基调听云UniAgent一体化,全自动,全栈式监控方案,实现从前端渠道到中后台交易的全链路跟踪能力,能够从交易出发识
别组件间依赖关系,快速判断业务异常,高效定位问题原因,迅速联动故障处理。
监控各微服务的性能、日志、指标,实时跟踪
服务的健康状况,及时发现和处理异常
支持应用、中间件和基础资源的层层下钻与关联分析,基于日志、指标、链路等数据,提供一站式分析
混合云环境下的全栈分析和问题边界的定位
背景:在运维工作中,业务的影响范围判定是运维工作的重点难点。当出现生产事故,业务部门要求运维部门快速确定影响的用户信息,降低生产事故对业务营收带来影响,因此运维人员需要对产生异常的影响进行快速判定。
实现路径:通过选取重要的交易类型,采用配置的方式提取关键业务数据,如基金产品ID、交易金额、交易流水、手机号等业务字段,当交易出现异常时,系统能够快速展现出每个异常影响的范围,并且可以在系统导出影响的交易数据,提供给业务部门。
听云深耕金融行业,服务于12家国有商业银行总行及全国性股份制商业银行总行,37家城市商业银行、农信社、农商行客户。
适配多家城商行客户系统框架,包括ESB、新核心、LTTS等
支持多家开发厂商的新核心系统监控,包括神州数码,长亮科技、信雅达等
c语言:监管查控系统
支付系统:新二代支付系统、境内外币支付系统、计费系统、ATM系统等
核心系统:分布式核心业务系统、信用卡核心系统。
ATM系统:通过APM WEB自定义业务错误收集ATM业务错误信息。
产品+服务
驻场服务
全程参与故障分析
文档输出
客户实际场景的定制化开发服务
智能报告:每周发送后端APM报告81封,客户端APM报告24封,WEB段APM报告82封。
报告包含:每周系统运行情况、异常问题进行汇总展示。
开发人员会根据运行报告中汇总的问题进行问题排查解决。