引言

天津区域前兆台网运行仪器有56套、测项分量有159个,仪器观测类型包括“十五”地震项目、“九五”地震项目和人工观测,它涵盖了形变、地磁、地电和流体学科以及辅助观测等。在日常工作中,每天通过软件、声音、短信、邮件、电话、人工等多种方式,对SQL Server数据库系统、Oracle数据库系统、供电系统、通讯链路、避雷系统等的运行状态按照规范要求进行认真地检查,若发现问题及时解决。同时随着设备数量的增加,对于管理工作的要求也越来越高。而在采用了网络化仪器后,相比以前提升了设备的在线监控能力。为了更好地实现对仪器的监控与管理,本文结合天津市地震局网络中心建立的Nagios开源网络监控的NagVis组件,实现了按区域、管理范围分类的网络化前兆仪器的在线运行状态监控和展示(王建国等,2009;2010a;2010b)。

1 Nagios开源网络监控系统介绍

2010年天津市地震局网络中心将建设好的Nagios(李刚等,2011a;2011b)开源网管系统开放到全局业务系统使用,其主要功能包括:网络仪器设备在线状态监控、网络应用与服务监控、综合监控图形展示、故障联动告警等几大功能(李刚等,2012)。系统投入应用以来,对全局199台网络设备与仪器、103项网络应用与服务以及虚拟化应用进行了24小时监控,涉及信息网络、测震、前兆、强震、GNSS、应急指挥等各个领域。

Nagios是开源网管系统中应用非常广泛的软件系统,可以对各类主机、设备、服务等进行详细监控,扩展功能强大,常用的组件包括Nagios-plugins、NDOUtils、NRPE、NSClient++、NagVis、Cacti等,其运行结构如图1所示。

图 1 Nagios系统监控结构示意图 Fig. 1Schematic structure of Nagios system monitoring
2 NagVis系统应用
2.1 NagVis简介

NagVis是Nagios的一个组件,简单来说,Nagios是一个底层监控平台,Nagvis是图形化的前台展示系统,它可以将各类信息以图形化的方式展示给用户,提高系统的可视化能力。它在用户选择的背景图片上显示主机和服务状态,背景图片必须是PNG格式,背景可以是图、系统文档图片、机房照片或者系统环境的示意图等,可以将监控对象放在背景图上的任何位置。

在展示中,NagVis会根据监控对象的状态显示不同的颜色图标。红色表示严重告警状态,黄色表示告警状态,绿色表示正常状态,灰色背景中的问号表示未知状态。

在默认的NagVis中,主机采用矩形图标,服务采用圆形图标表示。

NagVis具备声音告警功能,可对严重告警和告警状态设置各类告警声音,提醒用户注意。注意:如果要用到NagVis的声音报警功能,需要在PC机上安装QuickTime媒体播放工具。

NagVis正常安装与运行,需具备以下条件:①Nagios正常运行;②NDOUtils正常运行; ③Web server支持PHP5.0或以上版本;④系统中安装有版本要高于2.14的Graphviz组件;⑤PHP要包括PHP5-gd、PHP5-gettext、PHP5-mysql、PHP5-mbstring、PHP5-session、PHP5-xml等模块。

2.2 在NagVis中建立监控图形

在NagVis中建立监控图形,要通过2个步骤:①在Nagios中建立监控对象;②建立背景图片并通过NagVis将监控对象叠加到背景图片。这里不再详述Nagios系统监控配置方法,读者可以查阅相关手册或资料。

(1)用Visio制作拓扑结构图生成png格式图片。通过IE浏览器登录NagVis,点击[Edit current map]进入管理界面,右键打开管理菜单,选择[Manage]->[Backgrounds]打开背景图形管理窗口,如图2所示。

图 2 NagVis背景图形管理窗口 Fig. 2Background graphics management window of NagVis

(2)在图1所示的窗口中,选择[Upload background image]->[浏览]按钮,选择所用的png图片,并通过[Upload]按钮上传到NagVis中,完成后,可在background管理窗口中看到上传的图片。

(3)在NagVis的管理窗口中,右键打开管理菜单,选择[Manage]->[Maps]打开监控图形管理窗口,在[Create map]部分,输入或选择如下内容:

Map name:NagVis_Test 要建立的监控图形名称,注意:名称中不能有空格。

User with read permissions:EVERYONE具备查看此图形的用户,EVERYONE为所有人。

User with write permissions:nagiosadmin 能编辑与修改此图形的用户,默认只填写nagiosadmin(或Nagios的管理员)。

Map Iconset:std_small 监控图形中需要展示的图形类型,默认为std_medium。

Background:nagvistest.png 监控图形所用的背景图片,选择前面上传的nagvistest.png。

完成后,点击[Create]按钮,即可生成新的监控图形,如图3所示。

图 3 NagVis中的监控图形 Fig. 3The monitoring graphics of NagVis

(4)在图3中,点击[NagVis_Test]图形,打开图形监控窗口,点击[Edit current map]进入到此图形的编辑状态,背景图右键打开编辑状态菜单选择[Add object]->[Icon]->[Host],鼠标变成“十”字光标形状,将光标放到要显示监控信息的位置上单击,打开主机对象添加窗口。在[host]栏目中选择所需监控设备或主机,点击[Save],即可以看到此对象的监控图标已经对应地放置到监控图形中。

在host对象添加窗口中,有众多选项,其中host、x、y三项必须填写,host是选择在Nagios中已经监控的对象,x、y用于设定监控对象在背景图上的位置,如果发现监控对象的图标在背景图上有偏差,可以通过调整x、y值进行修改。

(5)在监控对象添加完成后,在监控图形上右键打开编辑菜单,选择[Open in NagVis]->[NagVis_Test],即可在NagVis中打开监控图形。此时在监控图形中,把鼠标放到监控对象图标中,即可以看到此对象的所有状态信息。包括主机状态,以及主机中的各项服务的状态等。

根据上面的方法,就可以将所需监控的各类仪器、设备和应用个性化放置到图形中,实现业务系统的可视化监控。

3 应用效果

掌握了NagVis的管理与应用方法后,作者在Nagios系统中对天津前兆台网所管理的各类IP仪器、设备和应用进行了监控,包括6台服务器和网络设备,30多套前兆仪器。对这些仪器和设备,按管理区域进行了划分,建立了前兆台网仪器设备拓扑图、8个专业地震台站的业务系统拓扑图(见图4),并为台站人员建立访问用户,可实时在线查看前兆仪器和设备的运行状态。表1为应用效果的对比。

图 4 前兆台网和蓟县地震台监控图形界面 Fig. 4Monitoring graphic interfaces of the Tianjin precursory network and Jixian seismic station
表1 应用效果对比 Table 1 Contrast of application effect

通过上述工作达到了以下目标:

(1)实现了对全局IP类前兆仪器和设备的统一监控,提升了对仪器设备和业务系统的监控能力,现在只要在行业网内的任何一台计算机上,通过浏览器就可看到设定好的仪器的运行状态图,具备了可视化监控能力。

(2)有了良好的监控,对各类故障的响应能力也得到了大幅度的提升,在某些仪器出现网络故障时,可在第一时间得到告警信息,通知相关人员及时检查并排除故障,使系统的运行率得到了有效的保障。

4 结语

NagVis作为Nagios开源网络管理软件的一个展示模块,在日常工作中能很好的解决实际问题,且并运行稳定可靠。因此,作者认为在今后的工作中,可以进一步扩大对开源软件系统的测试与应用,用很少的投资实现最好的应用。

致谢:本项工作得到了天津市地震局信息中心全体人员的大力帮助与配合,在此表示感谢!

参考文献
[1]李刚,周利霞,王晓磊等,2011a.开源网管系统在地震监测网络中的应用. 西北地震学报,33(4):380—385[本文引用:1次]
[2]李刚,周利霞,宋军等,2011b.基于VMware Esxi软件的服务器虚拟化技术在天津地震监测网络中的应用. 震灾防御技术,6(3):311—318[本文引用:1次]
[3]李刚,王晓磊,孙路强等,2012.基于Nagios软件的综合短信联动告警系统在地震行业中的应用研究. 地震研究,35(1):133—138[本文引用:1次]
[4]王建国,栗连弟,崔晓峰等,2009.数字化地震前兆台网日常工作管理软件. 地震研究,32(1):79—83[本文引用:1次]
[5]王建国,姚会琴,高逊等,2010a.天津市地震前兆台网的运行监控与维护管理. 大地测量与地球动力学,30(A01)111—115[本文引用:1次]
[6]王建国,聂永安,姚会琴等,2010b.天津市地震前兆台站综合评比及软件研制. 地震地磁观测与研究,31(增刊1)82—84[本文引用:1次]