银行一体化监控平台建设最佳实践.docx
《银行一体化监控平台建设最佳实践.docx》由会员分享,可在线阅读,更多相关《银行一体化监控平台建设最佳实践.docx(11页珍藏版)》请在咨信网上搜索。
1、 银行一体化监控平台建设最佳实践 目前很多银行针对各类设备、业务系统构建了各种监控,然而各个厂商、不同类别的监控系统就像一座座孤岛占满了监控大屏,各种监控各管一段,有些复杂的故障问题或性能问题的定位就变的尤其复杂,影响了问题的快速定位和故障处置。因此,如何构建一个一体化监控体系(或者统一监控体系),成为一个愈来愈紧迫的问题。【问题1】银行建设统一/一体化监控平台的主要原因?从需求角度分析原因:从技术发展上,目前很多银行目前已经上了新核心,用到了云,容器,微服务等新技术。从业务要求上,业务对稳定性要求越来越高,要求故障出现后更加及时的恢复,避免带来业务的损失。一方面,目前无论是大型、中型还是小型
2、银行都有统一监控平台的需求,不仅仅因为事件需要集中,为实现业务系统端到端的监控,必然需要多样的监控手段和技术去支撑,带来监控源的多样化,必然也需要统一的运维数据分析平台去揉合这些监控数据,辅助运维人员定位根因,甚至结合历史处理方式,直接定位故障根因和处理方法。另一方面,统一监控平台是应用稳定运行保障的基石(参考谷歌SRE),一体化的监控平台解决应用、业务、用户视角的监控,帮助用户实现根因分析,根因定位,容量预测等等。是企业数字化转型的必备工具。从技术角度分析原因:监控方式、技术和类型过多,需要一个统一的事件平台来集中丰富、处理和分析不同监控源的告警事件;还需要一个统一的数据接入平台(运维大数据
3、)来对不同监控源性能数据、日志和告警数据进行整合、分析、统计,借助AI的能力,智能辅助运维快速定位和根因分析;倘若银行企业端到端的监控源都比较完善(BPM、NPM、基础监控、APM、TPM等),可以进一步结合IT架构可视化系统,深化统一监控平台项目建设,通过将IT架构与多类数据源结合的方式,让架构图更加生动,运维人员在统一的可视化架构下,更为精准的定位故障。没有做到集中、统一监控、统一分析,那么各个系统是一套套毫无关联散沙,告警风暴来临时,多个告警平台同时告警,事件丰富的方式、联系人员也不同,运维人员像没头苍蝇,不仅无法快速判断故障根源,还可能会因多套监控平台的告警事件扰乱故障定位。【问题2】
4、银行信息系统监控领域产品类型有哪些?每类产品主要技术路线有哪些?整理了一张表格简要介绍下信息系统监控领域的产品类型和主要技术路线(点击可放大):【问题3】银行信息系统监控体系整体架构层次和关系是怎样的?这里有三张图,供大家参考。第一张图是整体监控、运维体系架构图,其中统一CMDB为所有系统和平台提供统一的配置基准数据,提升联动的数据质量和效果;自动化运维平台自动采集和发现价值数据和数据关联,供其他系统和平台使用,和各项资源建立自动化关联关系,提供不同自动化运维场景调用API,供其他系统和平台调用;集中监控平台对接所有监控系统和平台,实时收集所有事件和告警,结合CMDB配置数据,第一时间匹配和丰
5、富事件告警内容,以丰富的通知手段和详尽真实的告警详情告知相关负责人;运维大数据通过多样化、不同通道的方式,集成各系统和平台的实时或历史的结构化、非结构化数据,并进行过滤、清洗、加工、整合、分析、输出和数据持久化;IT架构可视化系统通过业务系统部署架构图、业务逻辑架构图、业务网络拓扑图三类架构图的方式,结合运维大数据中,不同数据源的数据,包括智能运维产出的建议,进行实时的展示,让数据和图联动,更为直观的展示业务系统整体运行状况。运维以IT架构可视化为主,智能运维为辅,强调人在运维中不可替代性。第二张图是网络性能管理(NPM)、运维大数据平台及与现有的基础监控和集中事件平台联动的整体功能逻辑架构图
6、。网络流量报文通过TAP设备发送至NPM服务器和BPC服务器的采集口;NPM系统和BPC系统实时解码模块,对网络原始比特流进行解析,输出网络层指标和业务应用层指标;业务层和网络层 数据分析模块实时分析性能指标:交易量、成功率、交易渠道、交易类型、金额、TCP连接状态、丢包状态、网络时延等等指标;前台展示模块从运维角度,可以实时的展示每一个节点的业务层和网络层指标情况,并配置实时告警,做到快速发现、快速定位、快速恢复;前台展示模块从业务运营角度,可以对全行交易情况进行实时大屏展示,对业务 交易渠道、交易机构、 交易金额、交易量 、 自定义的统计维度 等进行实时分类统计分析;业务性能监控系统对外的
7、接口包括数据输出接口、交易明细输出、告警接口:数据输出接口可将业务监控系统统计的交易性能数据和交易明细数据按JSON、CSV、xml等方式实时输出,提供给第三方系统。或者第三方系统可以通过RestfulAPI的方式来查询所产生的统计数据、告警数据、明细报文数据等。告警信息可通过syslog、socket等方式发送到第三方事件管理平台进行集成,统一进行汇总处理。本次实时解析的各系统性能数据,业务交易字段等实时推送给运维大数据平台,为实时运维大数据分析提供真实可信的数据源;业务交易及网络性能监控产生的告警事件,实时推送到现有集中事件平台 ;运维大数据平台产生的告警事件,实时推送到现有集中事件平台;
8、运维大数据平台可根据故障发生时间点,复原系统的性能、日志、网络报文等信息,辅助故障分析和快速解决 ;在集中了性能、配置、日志、事件等运维数据的基础上, 以运维大数据平台为核心, 开展智能运维在监控方面的建设,如单、多指标预测和分析、建议,告警事件自动关联知识库,指导运维人员快速解决问题,结合多类监控数据,进行可能的根因分析,辅助运维人员快速定位故障源,并在告警日志上下文历史挖掘分析、同类告警周期性规律分析、告警成对成组出现分析、告警相关与因果分析等等方面,进行智能分析,推进运维工作自动化和智能化 ;在各数据源数据统一接入运维大数据平台后,可为不同的用户的行为进行画像,供以后的精准营销或者风控项
9、目消费,进一步指导业务的运营和管理等。第三张图是运维大数据平台的整体架构图, 自下而上,最下面一层是数据源层,提供各种运维数据库包括结构化数据如关系型数据库以及非结构化数据例如各种系统日志,这些数据可以通过代理采集方式获取;另外一部分数据来源是现有系统,例如监控平台、网管、APM等工具,这些平台本身已经提供了各自该平台的事件或者性能数据,可以通过API的方式进行数据采集或者推送;数据源之上是运维管理总线,运维管理总线提供数据的接入、缓存、预处理,以及各个系统之间的消息传递、API调用。这一层通过搭建异步消息总线例如kafka集群来实现消息交互;第三层是数据处理层,包括两个方面,首先是大数据平台
10、,大数据平台提供的是数据流式解析(例如数据加工、实时告警),数据计算以及存储能力;另外一部分是智能算法层,主要提供、训练各种智能算法模型;数据处理层之上是接口层,接口层是为了根据不同的智能化运维场景提供接口调用,包括服务总线,主要提供API的注册、接口网关、状态、调用的管理,数据网关主要提供数据的查询,数据网关等功能;采用的架构为微服务架构和总线架构:微服务架构可以将运维子系统的所有功能、操作、指令全部转变为原子操作,接受AIOPS的总体调度。运维总线架构可以将各类系统的相互通讯模式由网状变为星型,降低关联耦合度,提高通讯的速度、稳定性、可用性、可扩展性,使得大数据通讯不再成为瓶颈;最上面一层
11、是AIOps场景层,该层次是通过调用API层提供的各种能力来实现智能化场景。场景层的设置是根据事件的生命周期进行设置的,例如在发现问题阶段通过自动基线、通过日志分类来判断异常,发现问题;到通过关联分析、日志深度检查、应用全链路监控等来分析问题;通过匹配知识库,调用运维调度平台来定位问题;最后通过智能预测来预测容量、故障的发生。另外提供了为领导层提供辅助决策的功能,例如系统画像、用户工单、请求分析等。【问题4】 银行信息系统监控涉及的系统、网络、应用等软硬件种类繁杂,如何进行有效的监控整合,避免各个监控系统之间的数据孤岛?监控系统之间目前确实很容易存在数据孤岛的问题,比如基础监控和业务监控,和网
12、络监控等,这些监控到的东西,无法形成统一的整体,割裂开来,造成网络做网络的监控、应用做业务的监控、系统做系统的基础监控,大家都是孤立的个体,最多通过统一的事件平台来展示和告警而已。这种现状,显然已经无法满足企业,尤其是银行企业的实际运维监控需求,因此如何把这些孤立的数据,协同、统一起来,变得十分的重要。有两种思路供大家参考:第一种是:运维大数据,通过对多运维数据源的汇总,分析,归纳,统计,形成一个统一的可视化运维分析平台,出现故障,不再是割裂的,而是统一的各类信息的整合, 实现统一分析,如根因定位,告警的影响性分析,应用容量分析和预测等等。另外运维大数据更重要的是多类监控数据源的数据,有结构化
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 银行 一体化 监控 平台 建设 最佳 实践
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【w****g】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【w****g】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。