计算机网络管理故障定位技术分析

时间:2022-06-14 10:14:47

计算机网络管理故障定位技术分析

摘要:计算机网络飞速发展的今天,网络系统的复杂度越来越高,需要处理的数据也越来越多,网络系统出现故障的几率显著升高。在网络管理过程中,故障的处理尤为重要,随着网络的不断运行,故障会随着网络不断传播,造成更大的影响。因此,如何准确、快速的定位出故障的具体位置是计算机网络故障管理中亟待解决的问题。本文通过详细分析基于SNMP管理协议下的事件关联策略进行的网络故障定位,并模拟了网络拓扑结构进行实验,实验表明该算法对日渐复杂的网络系统的网络故障定位有较强的优势。

关键词:网络管理;故障定位;SNMP管理协议;事件关联策略

计算机及网络技术的飞速发展为大中型企业带来了许许多便利之处,随着大型企业开发了与之业务相对应的管理系统,越来越多的业务将通过网络的方式进行,人们的衣、食、住、行都离不开网络[1]。计算机技术的飞速发展导致基于计算机的大型企业管理系统复杂度显著上升,与之相关的计算机网络的复杂度也随之提高。越来越复杂的网络环境为计算机网络管理带来了不小的挑战,需要网络管理者在保证海量网络集群能够正常工作的基础上,通过各种手段保证在运行过程中网络故障带来的影响和损失最小化,是计算机网络故障管理面临的主要问题。到目前为止,对于复杂度较高的大型网络系统都采用集中式管理方式,该方式将信息的管理和转发过程集中至一起,然后通过主要管理者进行分发和维护,系统的性能取决于中心管理者的管理能力。集中式管理方式面对大面积的计算机集群出现问题的时候,难以进行有效的处理,系统智能度较低,且中心管理者面对的管理任务较多,对于故障的传播无能为力,对于故障发生区域的定位也较为困难。集中式中心网络管理方式存在以下两类缺陷[2]:(1)计算机网络中心管理服务器需要面对成千上万待处理数据,这些数据冗余性大,数据处理时限要求高,仅仅通过中心管理服务器难以一一完成处理。集中式处理方式对中心管理服务器的性能要求较高,若中心管理服务器发生部分故障将会对整个网络系统的故障处理过程造成全方位影响。(2)计算机网络中心管理服务器面对巨大的计算机网络数据的吞吐量,在处理过程中,根据木桶原理,网络的整体性能受限于中心服务器处理数据的能力,中心管理服务器成为了整个网络系统的瓶颈。

1.基于SNMP协议的网络故障定位

在计算机网络管理中,与故障相关的管理包括故障发现、故障诊断和故障修复三个阶段。正常的逻辑是首先寻找并定位到故障发生的地方,才能针对不同的故障来进行分析和诊断,进而根据诊断结果将故障进行修复[3]。目前,在网络故障管理的三个阶段中,故障诊断和故障修复过程都有成熟完善的算法支持,而在故障定位过程中,由于故障的发生源可能范围较广,故障发生后会随着网络系统的运行而不断发展,且随着网络系统的复杂度提高,故障的传播越来越迅速、隐蔽,对于故障定位的相关算法目前还不完善具有较大的研究空间,所以研究并改进在大型网络系统中的故障定位算法是一项有意义的工作。

1.1SNMP协议故障定位与处理模型

SNMP协议用于计算机网络管理,是TCP/IP协议簇中最常用的应用层管理协议之一。该协议通过不断发出监听包到网络系统中各个设备上,通过设备的反馈包来检测对应设备是否发生网络异常。若某些网络设备发生异常并引起故障,一般情况下,在规定时间内SNMP无法接受到该设备的反馈包,这时候该协议即可初步定为出异常发生区域,并采取相应措施。基于SNMP网络管理协议的网络管理模型以网络管理系统NMS为中心,通过NMS与其他待管理的网络元设备节点构成了整个网络系统,SNMP协议运行在NMS之上,当网络系统运行过程中,某些被管理的网络元设备发生故障时,SNMP检测到该故障并发出警告信息,警告信息通过网络传播到其他网络元设备中,经过一定的时间,SNMP将警告信息传播到整个网络中,NMS对发生故障设备进行相应的处理。通过NMS的统筹管理,将会很快的定位出网络故障的具体位置并进行分析和解决。

1.2SNMP协议网络故障定位算法

由于计算机网络的复杂度不断提高,网络管理系统NMS无时无刻不在接收着来自多方节点的警报和征兆,在实际网络运行过程中,网络管理系统将会面对大量的警告信息,面对如此多的冗余信息,非智能的网络管理系统将会很难通过分析找出发生故障的真正节点设备,以至于大型网络很难对故障做出有效的处理。在网络管理运行过程中,网络中心管理服务器与各个被管理网络设备元之间相互依赖且各个被管理网络设备元之间存在物理上和逻辑上的相关性,所以每当一个设备元出现故障的时候,不仅自己要发出警告,而且所有感知到该设备元出现故障的设备都会发出警告,大量冗余的警告在网络中传播最终导致一个设备元发生故障产生大量的征兆,这些征兆都是相互关联在一起的,不能只针对一个征兆进行处理。在传统的SNMP协议中,检测到的网络设备故障征兆都是被单独传送给中心管理服务器的,这使得大量冗余的征兆信息干扰对网络故障的定位。事件关联策略在此背景应运而生,建立在基于SNMP协议上的网络故障定位新算法。在网络管理中,故障指的是网络中心管理服务器接受到的一个警告。事件关联策略定义了被管理的网络设备元在语义上的相关性,对被警告事件分别在空间上和时间上进行相关处理,通过提取各个事件中的相关联部分构成单一的警报概念事件,生成的单一警报概念事件能够过滤不必要的或者无关的事件,减少传送到网络中心管理服务器的冗余信息,中心管理服务器能够更好的计算并分析出网络故障的源泉。网络管理系统NMS面对诸多的警报和征兆,为了解决警报信息量大,信息冗余程度强的方法是在SNMP协议上采用事件关联策略,通过定义事件的方式来将警报编码成事件,再通过检测事件的相关联部分,丢弃无意义的冗余信息,仅仅通过“核心部分”的警报即可定位出故障源的真正区域,并给出故障解决方案。

2.基于SNMP协议和事件关联策略的网络故障定位实例分析

2.1网络拓扑图及初始化设计

本文通过模拟网络拓扑结构以及故障发生的环境,目的是呈现一种基于网络拓扑关联的网络故障定位技术,然后通过基于SNMP协议和事件关联策略来分析网络故障定位。本文通过建立一个网络拓扑结构来进行网络故障定位技术,寻找故障发生的源点,并根据该网络拓扑结构产生相应的节点表,关系表,和关联表。为了更加形象的表示网络的拓扑结构关系,本文需要给相应的拓扑结构节点添加虚拟的IP地址和该节点的属性。这些属性对后续实验的结果有重要意义,通过对网络设备的实际意义定性分析,就能够很好的完成对网络故障源点的定位和追踪,然后进行相应的网络故障分析和维护。

2.2基于SNMP协议软件关于该案例的实验结果

本文采用在SNMP协议上运行事件关联策略来定位故障源点,该策略主要是在主控模块中进行模拟的故障定位。在进入主控模块前,该策略还有模拟的发现网络拓扑结构模块和由拓扑结构创建连接关系的模块,接下来是通过连接关系创建关联关系的模块,该模块创建的关联关系是通过关联关系算法创建的,然后进入主控模块,在主控模块里连接着模拟输入故障数据模块,故障定位模块,以及故障源展示模块和故障事例显示模块。

3.总结

本文针对大型复杂的网络中难以定位故障的问题,分析了现有SNMP管理协议的各个方面,并详细分析了基于SNMP管理协议,使用关联关系进行故障定位算法的研究。在实际试验环境中,本文通过使用基于SNMP的管理协议来进行模拟网络拓扑结构的故障定位过程,实验结果表明,使用SNMP管理协议进行的网络故障源精确度高,分析速度快,适合日渐复杂的网络系统。

作者:崔玉礼 单位:烟台职业学院

参考文献:

[1]韩莉莉.网络管理系统中数据库的设计与实现[J].无线互联科技,2014,(8):24-24.

[2]李建国.电信网络安全隐患与对策探析[J].科技视界,2014,(32):57-57,103.

[3]罗志权.计算机网络故障的识别与解决方法[J].环球市场信息导报,2014,(7):130.

[4]闫敬东,马全福.报文分析仪在网络故障分析中的应用[J].科技风,2015,(16):92-93.