案例背景

作为落实IT战略规划的一个基础核心的项目,国航于2009年在经过广泛调研之后,决定采用基于SOA架构的信息共享体系结构建设国航信息共享平台,将国航内部现有的各应用系统之间可以共享、共用的数据和服务发布到共享平台上供其它业务系统使用,以适应国航在战略推进、业务发展过程中对业务流程共享、信息共享和调整应用系统快速适应市场变化等需求。目前系统已经初具规模,实现了企业SOA架构的核心部件:企业服务总线(ESB),并提供了附加的管理、监控、稽核的能力。

虽然IBM的ESB平台提供了监控工具软件,但是根据国航信息共享平台一期多年运行情况来看,远远不能满足平台运维的需要。新系统上线反而在一定程度上增加了运维工作量,距离将信息共享平台时刻保持在最佳状态还有可提高的余地。为此,本次系统需要结合过去运维实际过程中积累的大量宝贵经验,开发一套贴近工作实际,贴近国航信息平台现状的监控系统,服务于信息平台的管理者。实时状态监控不仅要能够对信息共享平台的各种KPI数据进行高效采集,而且需要最大程度上地保证不对信息共享平台的业务执行造成任何不良影响。实时状态监控涉及到的KPI数据指标较多,需要在一个人性化的仪表盘界面进行集中展示,方便管理人员查看,要做到关键信息一目了然。对于实时状态监控得到的数据,系统需要能够自动根据预设的告警条件进行比对,一旦发现异常值,系统能够通过多种形式进行告警,通知相关人员,及时应对进行有效地干预,保障信息共享平台高效平稳地运行。

总之,目前SOA系统面临着某些业务系统信息反馈不及时,影响国航各类信息系统的运行,同时对于运维管理人员来说,缺乏一套行之有效监控运维系统对国航SOA系统进行管理和运维。

实施方案

国航SOA系统是国航各业务系统之间信息交换的桥梁,因而监控掌握SOA系统的运行状态并提前发现问题,是保障各业务系统稳定运行的有效手段。为了针对已经建设的国航SOA系统的运行状况进行全方位的监控,获取系统的运行状态,并进而分析存在的问题,保障国航各业务系统的稳定运行。具体如下:

  • 监控SOA总线服务系统,通过SOA服务系统性能采集脚本,获取其各种系统指标的运行数据和状态。
  • 对SOA系统的周边设备及中间件等资源进行监控,深入监控能力,提供全方位一体化的监控。
  • 构建可扩展的业务监控平台,为国航未来的多个业务系统及IT环境提供统一监控平台。

根据实际分析,国航SOA系统属于第三方待监控资源,SaCa Aclome产品自身不支持对其进行监控,但是SaCa Aclome不仅是一个产品解决方案,更是一个平台,它提供了插件化的监控框架,允许任何人基于此平台进行扩展,以支持对其他类型资源的监控。

本建设方案通过在后端基于SaCa Aclome产品可扩展框架,自定义实现了针对国航SOA系统、硬件负载均衡、中间件等资源的监控插件,对此类资源提供状态监控及指标采集;另外在前端页面也进行了扩展,SaCa Aclome产品的前端页面也是采用组件化的方式构建,只需要扩展相应页面组件,并加入组件库中,系统即可识别添加新的业务界面,进而极大的节省了项目开发成本,加快了开发进度。
具体方案如下图所示:

实施效果

借助SaCa Aclome产品,通过简单的扩展轻松实现了对监控资源的扩展,屏蔽了系统绝大部分开发工作量和技术难点,满足业务系统的监控需求,加速了项目的开发和上线。同时为客户提供的不仅是产品更是一个平台,可以根据实际需要扩展产品的内涵和外延。

相关产品