全面复工之前,如何在疫情下安全开展基础教学和学习工作对教育行业至关重要。1 月 29 日,教育部发文:利用网络平台,“停课不停学”,全国大中小学教育工作者和学生涌入在线教育平台。与此同时,高校师生也陆续通过线上和远程的方式,开展教学与科研相关工作。

在连接外部互联网进行公网交互的场景下,高校内部校园网面临着巨大的流量冲击和并发挑战。同时,高校科研项目的推进与论文发表势不容缓。因此,保障高校线上系统友好的交互体验与稳定,帮助高校减缓疫情带来的影响,成为高校师生与科研人员共同迫切的诉求。

  • 门户系统,保驾护航

高校门户、办事大厅等系统是师生日常访问使用的高频系统,由于疫情的影响,大部分学校推迟了开学时间,师生居家学习办公登录门户网站等相关系统,唯有依赖于远程连接,学校门户站点的并发访问量激增,易造成页面卡顿、崩溃,系统功能失效等问题。东软 APM 为高校提供办事大厅监控运维解决方案,并通过地域、运营商、接入方式等多维度性能数据实时展现门户等相关系统网页的健康状态,致力于保障高校门户与相关业务系统功能的稳定运行。

以某高校办事大厅及相关服务的监控为例(图1,图2),让我们一起关注监控系统能够为疫情下的运维保障做些什么:
HTTP 监控能够实时掌控办事大厅页面动态,确保疫情期间校园门户各系统正常登陆并使用。

图 1

图 2

用户行为分析令高校系统管理人员掌握师生的页面访问习惯,从而找出系统的潜在问题与风险,有助于学校门户系统的优化和调整。而基于应用堆栈调用的分析能够深入门户页面及相关服务的内部结构,分析各服务间的依赖和调用关系,为系统优化、门户性能的提升提供进一步的依据(如图3)。

图 3

春节期间,受疫情影响,某高校办事大厅在线统计学生体温的系统服务中,出现页面响应慢、系统卡顿等问题,在 APM 系统中,所有的页面请求得以捕获,并实时追踪到响应时间过长(超过 5S)的请求。(图4)

图 4

经过应用堆栈的分析,查询定位到指定的代码段(SQL语句)执行超时(图5)。

图 5

故障原因摸清后,经过高校运维团队的优化调优,系统延迟的请求得以排除,事务相应时间恢复至 3s 以下,系统恢复友好的交互体验(图6)。

图 6

  • 科研资源,安全远程

高校科研人员在远程办公期间,需要频繁地远程连接校园内网,获取内网资源,下载科研论文和相关材料,校园网络访问量倍增,远程连接稳定性堪忧,资源下载卡顿,连接中断的情况时有发生,运维人员难以处理和维护。(图7)RealSight APM 可提供远程请求的全链路追踪服务,显示请求链路的全景拓扑图,涵盖应用拓扑、网络、数据库、中间件、微服务、容器等整套运行环境及其数据交互和相互间依赖关系,助力高校运维人员排查系统故障,解决运维风险,构建安全远程环境。

图 7

  • 教务数据,实时监控

教务系统作为高校落实教学工作、考察教学质量、安排教学工作的核心系统,其重要性不言而喻。疫情之下,教务工作更加依赖于线上系统,关键时期,教务系统故障频发是高校管理者和教务工作者急需解决的难题。

图 8

(如图8、图9所示)东软 RealSight APM 成功为某高校提供教务系统监控解决方案,通过教务系统的数据库监控、Nginx服务监控、门户页面监控等组件,全方位保障教务系统的正常运行,即使在教务系统发生异常情况时,也能够及时告警并追踪到问题产生根源,大大缩减系统恢复时间,助力高校教务工作顺利进行。

图 9

  • 携手东软,共克时艰

抗击疫情,共克时艰。行业信息系统的运维保障也是一场无声的战争,从运维角度而言这次疫情也是对线上系统的一次检验,东软 RealSight APM 的运维能力与经验能够为高校业务系统运维提供全面解决方案,助力教育及科研工作顺利开展,减少疫情对高校教育工作的影响。

相关产品