APP下载

ZABBIX监控系统在河钢承钢局域网中的应用

2017-04-23李静

电子技术与软件工程 2017年5期
关键词:计算机网络

李静

摘 要 随着网络技术的广泛应用和网络规模的不断扩大,网络设备的的稳定性和可靠性成为不容忽视的重要因素,仅仅依靠人工手动的进行管理与监控早已不能完全适应实际情况。通过使用网络监控系统,管理员能够获取网络中各类被监控实体对象的性能数据,掌握系统的运行状况,及时发现相关问题。这给网络管理员提供了一种方便,高效的管理方式。本文以河钢集团承钢公司的企业内部网为研究对象,以Zabbix为实现平台搭建了一套企业级分布式内网监控系统。本系统对内网进行实时监控,使管理员能够随时掌握系统运行状况,以及资源使用情况,并且能及时接受系统发出的各种异常事件。

【关键词】计算机网络 分布式监控系统 Zabbix

1 背景介绍

河钢承纲公司的局域网于2002年实施ERP工程时建成并初具规模,到目前为止包括四级网络办公系统,三级计量系统,生产信息采集网络,能源网络,视频及门禁网络,整个网络拥有交换机,路由器,防火墙等网络设备300多台,小型机及服务器50多台,主机及终端设备2000多台。随着网络规模的不断扩大,网络及主机,数据库的故障也时有发生,维护人员需要花费大量的时间精力来处理用户的报修和对设备频繁的点检来保证信息系统的正常运行,运维人员的任务很繁重,而且总是得等到出现问题的时候才能发现。现在迫切需要更为有效的监控系统来实现对所有网络设备的全面掌控,以此提高维护的效率和水平,降低维护人员的劳动强度。经过综合的研究分析,我们发现Zabbix相对其他监控来说,它的总体功能做得非常优秀,它是一个分布式监控系统,支持多种采集方式和采集客户端,有专用的Agent(代理),也可以支持SNMP、IPMI、JMX、Telnet、SSH 等多种协议,它将采集到的数据存放到数据库,然后对其进行分析整理,达到条件触发告警。其灵活的扩展性和丰富的功能是其他监控系统所不能比的。

2 zabbix系统架构及主要功能

Zabbix是一个基于Web界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案。它能监视各种网络参数,保证服务器系统的安全运行;并提供灵活的通知机制以让系统管理员快速定位、解决存在的各种问题。Zabbix由两部分构成,Zabbix Server与可选组件Zabbix Agent。

支持zabbix代理(Proxies),通过Server- Proxies-Agent 这种模式实现分布式监控,集中展示的功能。一个zabbix代理(Proxies)可以代表zabbix服务器收集性能和可用性数据。这样,代理(Proxies)可以负担采集数据的任务并且减轻zabbix服务器负载同时,使用代理(Proxies)是实施统一和分布式监控的最简单方式,因为所有的客户端和代理(Proxies)向一个zabbix服务器报告数据,并且所有数据集中保存在服务器数据库。目前这种方式已成功应用在公司数据中心采集网络中,实现了对力控网关的实时监控。

3 在承钢局域网生产环境中的应用

3.1 目前利用zabbix监控系统已经实现了对四级网络交换机的监控

三级计量网络设备,管控作业区二级系统服务器,采集机主机、oracle数据库、力控网络等设备的监控,并绘制了拓扑图,实现了对设备可视化,趋势化的管理,通过设定触发器的阈值,在设备出现问题之前,发送告警信息,并发送邮件到相关管理人员。同时可以发送语音告警信息。实现了手机客户端的应用。对出现问题的设备可以根据历史趋势图和最新数据信息和报表等综合查找出分析出现故障的原因,使得问题可追溯。

3.2 实现了对主机日志,进程的监控,Web的监控

zabbbix可以用于支持/不支持翻转的日志文件的集中监控与分析。当一个日志文件包含特定的字符或者字符模式时,zabbix向用戶发送报警信息。服务器上跑着一些重要程序,需要对它们进行的进程监控。可以在特定机器或模板上创建新的监控项,或zabbix中添加自定义脚本对特定程序进行监控,通过添加触发器实现告警。zabbix对Web性能的监控,通过它可以了解Web站点的可用性以及性能。最终将各项指标绘制到图形中,这样我们可以了解到一个站点的下载速度、响应速度等。

3.3 利用IT-SERVER功能,report(报表)和聚合检查功能,实现了对监控设备整体水平的了解和掌控

通过这几个功能,可以查看一个星期、一个月、或一年,主机或设备群组的信息,便于我们有针对性的对某些或某类设备进行关注,做出相应的整改措施。

3.4 完善了设备资产清单

监控的设备越来越多,有时候搞不清楚哪台服务器是什么配置,大多公司有自己的资产清单,要去专门的系统查询显得多少有点麻烦。为此,zabbix专门设置了设备资产管理功能。我们创建或者编辑主机的时候,可以看到清单(inventory)功能。里面大致包含mac地址、硬件信息等等几十项。

4 系统性能的优化

与其他应用系统一样,当zabbix遇到性能瓶颈时,也会表现出CPU负载值长时间维持在一个较高的水平上、zabbix队列中有太多被延迟的item,zabbix绘图中经常性出现断档,一些item没有数据,前端页面无响应,历史同步数据的进程繁忙等一系列问题,为了解决这些问题,我们主要从四个方面做了优化,

4.1 MYSQL数据库的优化

zabbix系统是一种重数据库型的应用系统,所有,数据库服务器性能的高低对于zabbix整个性能的高低具有重大的影响。在数据库方面,主要做了数据库的表分区以及MySQL服务器参数的调整工作。

4.2 zabbix系统组件的优化

对zabbix系统组件的优化,主要是多某些配置项的参数值进行调整,从而获得最大化的系统性能。通过修改采集进程的数量和缓存的大小来进行调优。

4.3 操作系统的优化

主要有以下几个方面:选择快速磁盘陈列级别;调整数据块大小提高文件系统I/O性能;调整I/O调度器;Linux内核参数优化;关闭非必要的服务。第四、Apache的性能优化。通过设置ServerLimit和MaxClients来达到为服务器软扩容的目的。

5 结束语

Zabbix监控系统在公司内网中的成功应用,为网络运维人员判断故障提供了很好到帮助,大大提高了故障预处理的响应速度,降低了设备发生故障的概率。接下来还有很多工作需要进一步的完善,对系统的进一步消化,吸收和应用,对已有的功能进行更深入的研究,对设备对zabbix服务器性能的优化,让系统变得更加稳定。实现监控的可视化,趋势化和智能化。

参考文献

[1]吴兆松.Zabbix企业级分布式监控系统.第一版[M].北京:电子工业出版社,2014

猜你喜欢

计算机网络
基于模式匹配的计算机网络入侵防御系统
云计算下的计算机网络安全性研究
面向对象的计算机网络设计软件系统的开发
关于计算机网络存储技术分析
计算机网络环境下混合式教学模式实践与探索
计算机网络信息安全及防护策略
计算机网络可靠性的提升策略
计算机网络技术的应用探讨
计算机网络维护工作的思考
浅析计算机网络管理系统的构建和应用