容错技术范文10篇

时间:2023-04-10 09:33:21

容错技术

容错技术范文篇1

1可靠性和容错技术可靠性是火控系统的一项主要指标,因此,可靠性设计是火控系统设计的重要内容。在实时应用系统中,通常度量系统的可靠性用系统在时间区间[0,T]内连续正确运行的概率,即系统的可靠度。容错技术是提高系统可靠性的重要途径。

容错技术的实质是通过资源的冗余配置使系统在内部发生故障时,仍然能够正确执行预定任务,从而提高系统的可靠性。容错技术通过冗余结构提供的信息来克服故障的影响,它不依赖工艺水平等因素而仅与系统的结构有关,只要提供足够的冗余,就可以把系统的失效概率减少到任意希望的程度。

2容错技术应用分析容错技术对故障的处理方式,常采用故障检测、故障屏蔽和动态冗余。

2.1故障检测技术为了检测故障,必须提供冗余的信息来指示故障是否发生。因此,系统的输出向量应由两部分组成,一部分是系统的功能输出,另一部分是用于指示系统内部是否发生故障的检测输出。抽象地,把无故障情况下的一次功能输出和检测输出所构成的向量称为码向量,所有码向量组成的集合称为码。于是,对于一个系统的输出码,如果存在一个故障集,使得故障集中的任意故障发生将使系统的输出向量不属于该码,则称该码是对故障集的一个检错码。

故障检测电路的设计实质上就是上述定义的直接应用。如果一个电路的无故障输出空间构成一个检错码,则称该电路是自检测电路。飞机航空军械检测系统、火控平显系统都设置有自检测系统。在正常工作状态下,能不断地反复进行测试,系统95%以上的故障、错误都能被检测出来,并能查到每一个大的工作部件。TOW型电源的机内测试系统是一个典型的自检系统。

该电源的功能是将24.5V直流电压变换成三种隔离输出的直流电压:24V,+50V,-50V。该电源的机内测试系统的功能是连续监测电源有关参数,被测电源输出电压由J2送到自检系统,控制器通过模拟数据采集板对电源输出电压连续取样,测量比较,以判断电源输出电压是否在标称值之内。若超差则发生视觉显示或合成音响告警。

2.2屏蔽技术屏蔽技术通过冗余资源来隔离或校正故障的影响,从而达到容错的目的。屏蔽技术使系统结构固定不变,因此,屏蔽技术也称静态冗余技术。与故障检测类似,有些屏蔽技术可以看成是纠错码的电路实现。但是,与检测技术不同,屏蔽技术不要求一定要把冗余信息送到系统的输出端,它可以在故障出现时立即把它屏蔽掉。例如,四重冗余二极管电路中,一旦有一个二极管发生开路或短路故障,立即被别的二极管上的信号屏蔽掉。

2.3动态冗余技术动态冗余的思想是,当故障发生时,通过系统内部的一次重组来切除或替换故障部件。如果系统具有屏蔽能力,重组可推迟到耗尽屏蔽冗余时再进行。重组实际上起着补充冗余、延长系统寿命的作用。

容错技术范文篇2

当系统内部有故障存在时,通过容错技术消除故障的影响,使系统最终仍能给出正确的结果。按照时间划分,故障可分为以下三种:永久性故障、间歇性故障和偶然性故障。永久故障是永远持续下去直至修复为止的故障。对硬件来说,永久性故障意味着不可逆的物理变异。对软件来说,这类故障也就是一个不可以自动恢复的错误状态。间歇性故障是短暂的,但却是断续的,它既有偶然性,又有不定期的重复性。如一个处于临界状态的电路输出时好时坏,而一个虚焊点就会引起这样的故障。偶然性故障出现是短暂的,且可能是非重复性的。常常由于环境的变换、电源方面的干扰、元器件性能的波动、软件的随机变换、电磁干扰等因素而引起。这样的故障有可能仅出现一次,或很长时间出现一次,但却可能造成数据错误,甚至系统瘫痪。

针对不同故障应采取不同的容错方法。容错技术能自动适时地检测并诊断出系统的故障,然后采取对故障的控制或处理的对策略。按照系统的失效响应阶段,可以把各种容错技术分成三种:故障检查、静态冗余、动态冗余。故障检测并不提供对故障的容忍,而是发生故障时给出一个警告。故障检测广泛应用于微型机和小型机之类的小系统中,其中一些已体现了简单的联机检测机理。严格地说,故障检测不是容错,它尽管检测了故障,但是不能容忍这些故障,不给出故障警告。动态冗余用于纠错码存储器或具有固定配置(即线路器件之间的逻辑连接保持不变)的多数表决冗余计算机之类的系统中。

根据不同情况,一个容错系统可经历以下阶段:(1)故障检测:大多数失效最终导致产生逻辑故障。有许多方法可用来检测逻辑故障,如奇偶校验、一致性校验和协议违章都可以用来检测故障。故障检测技术有两个主要的类别,即脱机检测和联机检测,在脱机检测情况下,进行检测时设备不能进行有用的工作;联机检测提供了实时检测能力,因为联机检测与有用的工作同时执行。联机检测技术包括奇偶校验和冗余校验;(2)故障限制:当故障出现时,希望限制其影响范围。故障限制是把故障效应的传播限制到一个区域内,从而防止污染其他区域;(3)故障屏蔽:故障屏蔽技术把失效效应掩盖了起来,从某种意义上说,是冗余信息战胜了错误信息,多数表决冗余设计就属于故障屏蔽;(4)重试:在许多场合,对一个操作系统的第二次试验可能是成功的,对不引起物理破坏的瞬间故障尤其如此;(5)诊断:对故障检测技术没有提供有关故障位置、性质的信息进行诊断;(6)重组:当检测出一个故障并判明是永久性故障时,重组系统的器件替换失效的器件或把失效的器件与系统的其他部分隔离开来,也可使用冗余系统,确保系统能力不降低;(7)恢复:经检测和重组后,必须消除错误效应。通常,系统会回到故障检测前处理过程的某一点,并从这一点重新开始操作。这种恢复形式通常要后备文件、校验点和应用记录方法;(8)重启动:如果一个错误破坏的信息太多,或者系统没有设计恢复功能,那么恢复就不可能实现。仅当系统未受任何破坏时,才能进行“热”重启,并从故障检测点恢复所有的操作。“热”重启相当于系统需要完全重新加载;(9)修复:即把诊断为故障的器件还原下来,修复也可以是联机进行的或者脱机进行的;(10)重构:对元件进行物理替换之后,把修复的模块重新加入到该系统中去。对联机修复来说,实现重构不中断系统的工作。

随着计算机硬件和网路的快速发展,容错计算机的系统开销逐渐降低,且纠错速度快。而软件方法实现的容错,对硬件不会提过高的要求。同时系统灵活,资源利用比较合理。更正检测、诊断将会采取人工智能的处理途径,以专家系统的各种智能工具来支持故障检测和诊断。利用专家的知识,借助推理机构,迅速而准确地提供诊断结果。系统的动态重构、故障恢复功能及神经元芯片等将被用到容错技术中来,都将在智能化的支持下得以实现。同时对电路内部的自检、自重构研究,可以解决电路本身及子系统的可靠性问题,将会出现容错的VLS1芯片及可直接支持系统容错设计的可容错设计芯片,为系统设计者提供一个具有透明性的容错设计元器件。进入到芯片内部的容错技术的研究将成为容错研究的一大分支。

随着网路时代的到来,对于一个成功的电子商务系统来说,必须响应在线客户的需求并遵守服务的那个协议(SLA),同时保护客户的隐私及电子商务系统安全正常运营。对于客户要求的响应程度及安全保护措施是一个基于Internet的电子商务系统成功的必要条件,容错服务器就成为网络时代电子商务运营商首要选择。未来的智能化家庭都将拥有一个家庭数据中心,可提供全天候的服务,包括家庭安全、防盗和防煤气泄漏以及各种家用电器的控制,这个家庭数据中心也只有采用容错计算机才能担当。今后容错技术将同时在软件和硬件上得到发展,将会出现初级的容错软件的设计方法,应用软件方面的容错设计将会产生一些实用的工具,同时产生一个通用操作系统和硬件相结合的容错方法,走软硬结合的道路。系统容错设计将在分布式系统、CSCW等方面出现新的容错设计方法。

[摘要]随着计算机技术的发展,容错技术和容错计算机将成为新的研究发展方向。本文介绍了容错技术的基本原理及内容,介绍了容错系统的经历阶段和实现容错功能的关键技术,总结了计算机容错技术的现阶段的应用情况。

[关键词]容错技术可靠性容错功能

参考文献:

[1]胡谋.计算机容错技术[M].北京:中国铁道出版社.

[2]杨孝宗.容错计算技术的提出和发展[J].电子和信息化.

容错技术范文篇3

当系统内部有故障存在时,通过容错技术消除故障的影响,使系统最终仍能给出正确的结果。按照时间划分,故障可分为以下三种:永久性故障、间歇性故障和偶然性故障。永久故障是永远持续下去直至修复为止的故障。对硬件来说,永久性故障意味着不可逆的物理变异。对软件来说,这类故障也就是一个不可以自动恢复的错误状态。间歇性故障是短暂的,但却是断续的,它既有偶然性,又有不定期的重复性。如一个处于临界状态的电路输出时好时坏,而一个虚焊点就会引起这样的故障。偶然性故障出现是短暂的,且可能是非重复性的。常常由于环境的变换、电源方面的干扰、元器件性能的波动、软件的随机变换、电磁干扰等因素而引起。这样的故障有可能仅出现一次,或很长时间出现一次,但却可能造成数据错误,甚至系统瘫痪。

针对不同故障应采取不同的容错方法。容错技术能自动适时地检测并诊断出系统的故障,然后采取对故障的控制或处理的对策略。按照系统的失效响应阶段,可以把各种容错技术分成三种:故障检查、静态冗余、动态冗余。故障检测并不提供对故障的容忍,而是发生故障时给出一个警告。故障检测广泛应用于微型机和小型机之类的小系统中,其中一些已体现了简单的联机检测机理。严格地说,故障检测不是容错,它尽管检测了故障,但是不能容忍这些故障,不给出故障警告。动态冗余用于纠错码存储器或具有固定配置(即线路器件之间的逻辑连接保持不变)的多数表决冗余计算机之类的系统中。

根据不同情况,一个容错系统可经历以下阶段:(1)故障检测:大多数失效最终导致产生逻辑故障。有许多方法可用来检测逻辑故障,如奇偶校验、一致性校验和协议违章都可以用来检测故障。故障检测技术有两个主要的类别,即脱机检测和联机检测,在脱机检测情况下,进行检测时设备不能进行有用的工作;联机检测提供了实时检测能力,因为联机检测与有用的工作同时执行。联机检测技术包括奇偶校验和冗余校验;(2)故障限制:当故障出现时,希望限制其影响范围。故障限制是把故障效应的传播限制到一个区域内,从而防止污染其他区域;(3)故障屏蔽:故障屏蔽技术把失效效应掩盖了起来,从某种意义上说,是冗余信息战胜了错误信息,多数表决冗余设计就属于故障屏蔽;(4)重试:在许多场合,对一个操作系统的第二次试验可能是成功的,对不引起物理破坏的瞬间故障尤其如此;(5)诊断:对故障检测技术没有提供有关故障位置、性质的信息进行诊断;(6)重组:当检测出一个故障并判明是永久性故障时,重组系统的器件替换失效的器件或把失效的器件与系统的其他部分隔离开来,也可使用冗余系统,确保系统能力不降低;(7)恢复:经检测和重组后,必须消除错误效应。通常,系统会回到故障检测前处理过程的某一点,并从这一点重新开始操作。这种恢复形式通常要后备文件、校验点和应用记录方法;(8)重启动:如果一个错误破坏的信息太多,或者系统没有设计恢复功能,那么恢复就不可能实现。仅当系统未受任何破坏时,才能进行“热”重启,并从故障检测点恢复所有的操作。“热”重启相当于系统需要完全重新加载;(9)修复:即把诊断为故障的器件还原下来,修复也可以是联机进行的或者脱机进行的;(10)重构:对元件进行物理替换之后,把修复的模块重新加入到该系统中去。对联机修复来说,实现重构不中断系统的工作。

随着计算机硬件和网路的快速发展,容错计算机的系统开销逐渐降低,且纠错速度快。而软件方法实现的容错,对硬件不会提过高的要求。同时系统灵活,资源利用比较合理。更正检测、诊断将会采取人工智能的处理途径,以专家系统的各种智能工具来支持故障检测和诊断。利用专家的知识,借助推理机构,迅速而准确地提供诊断结果。系统的动态重构、故障恢复功能及神经元芯片等将被用到容错技术中来,都将在智能化的支持下得以实现。同时对电路内部的自检、自重构研究,可以解决电路本身及子系统的可靠性问题,将会出现容错的VLS1芯片及可直接支持系统容错设计的可容错设计芯片,为系统设计者提供一个具有透明性的容错设计元器件。进入到芯片内部的容错技术的研究将成为容错研究的一大分支。

随着网路时代的到来,对于一个成功的电子商务系统来说,必须响应在线客户的需求并遵守服务的那个协议(SLA),同时保护客户的隐私及电子商务系统安全正常运营。对于客户要求的响应程度及安全保护措施是一个基于Internet的电子商务系统成功的必要条件,容错服务器就成为网络时代电子商务运营商首要选择。未来的智能化家庭都将拥有一个家庭数据中心,可提供全天候的服务,包括家庭安全、防盗和防煤气泄漏以及各种家用电器的控制,这个家庭数据中心也只有采用容错计算机才能担当。今后容错技术将同时在软件和硬件上得到发展,将会出现初级的容错软件的设计方法,应用软件方面的容错设计将会产生一些实用的工具,同时产生一个通用操作系统和硬件相结合的容错方法,走软硬结合的道路。系统容错设计将在分布式系统、CSCW等方面出现新的容错设计方法。

[摘要]随着计算机技术的发展,容错技术和容错计算机将成为新的研究发展方向。本文介绍了容错技术的基本原理及内容,介绍了容错系统的经历阶段和实现容错功能的关键技术,总结了计算机容错技术的现阶段的应用情况。

[关键词]容错技术可靠性容错功能

参考文献:

[1]胡谋.计算机容错技术[M].北京:中国铁道出版社.

[2]杨孝宗.容错计算技术的提出和发展[J].电子和信息化.

容错技术范文篇4

关键词:3G视频通信H.264/AVC容错技术

传统的视频编码标准都是围绕比特流的概念组织的。实际上用于传送数字视频的大多数网络体系结构并不适合直接传输比特流。在许多网络体系结构中,比特流需要拆分为数据分组。这些分组的特性,如最小/最大尺寸、相关开销和差错属性等在网络体系结构间、甚至在某个给定的网络体系结构内也是很不相同的。假如视频编码器自身能和网络特性很好的匹配,将能够获得更好的视频QoS。问题是如何容错地支持易差错的无线移动网络?为了解决无线移动信道视频的容错传输,我们将采用如前向纠错编码及支持差错复原的视频压缩编码技术来解决。H.264编解码器可以很好的解决易差错信道的视频容错传输。在3GPP/3GPP2的传输环境下通过选择适当的条带长度使H.264编解码器和无线移动信道的网络特性得到很好的匹配,实现无线移动信道视频的容错传输。H.264标准适用于无线网络传输的主要原因之一就是在概念上分为两层:视频编码层VCL(VideoCodingLayer)和网络抽象层NAL(NetworkAbstractionLayer),其中VCL负责高效的视频内容表示,它被设计成尽可能独立的网络,NAL负责对编码信息进行打包封装并通过指定网络进行传输。H.264中还定义了两种新的帧编码类型,即SP帧和SI帧来完成不同流的切换,可以根据传输网络和用户终端的具体情况自适应地在不同码率的视频流之间切换,这大大改善了视频流对3G网络的适应性。

一、3G视频通信中容错技术的应用

3G通信技术的出现使对话式无线视频业务成为可能,虽然3G网络在移动环境下的带宽可达384kbps,在静止环境下的带宽可以达到2Mbps,但是由于信道衰减、建筑物遮挡、终端移动、多用户干涉等原因影响,使得信道是时变且高误码的,因此,在3G网络上传输视频流时,仅仅追求高的压缩效率是不够的,必须有一定的容错和错误掩盖措施。最新的3GPP/3GPP2标准要求3G终端支持H.264/AVC视频编解码技术,同时由于硬件的限制,3G终端只支持部分H.264/AVC的容错工具。H.264中虽然提供了一些容错工具,但是它们有各自不同的用途和目的,即在不同的场合需要选择不同的组合来使用。

1.1错误隐藏技术由于错误隐藏技术能够利用接收到的数据来恢复丢失的数据,因此一般都应用在解码器端。在无线网络环境中,解码器的这种能力尤其重要,因为无线网络环境中误码率高,很多RTP包在传输中被网关或者路由器丢弃,而这些丢失的数据又必须在解码器端根据空间和时间上的相关性来恢复。错误隐藏技术的实现方法也很多,在JVT参考软件中,就使用了一种空间相关性的方法,即使用被丢失宏块周围的4个宏块来恢复被丢失的数据,其选用的标准是使恢复后边缘数据的SAD(sumofabsolutedifference)差最小。这种方法的效果虽不是最好,但是计算简单有效。

1.22Slice结构为了满足MTU大小的要求,在3G网络视频传输中对视频进行分片压缩显得尤其重要。经过分片压缩后的视频中每个RTP包中包含一个片,一般每个slice中包含一个或者几个宏块,并以RTP包的大小满足MTU的要求为准。

1.3帧内编码块刷新由于帧内编码不依赖时间上相邻帧的数据,所以帧内编码块能有效地阻止由于包丢失甚至帧丢失而引起的错误传播。对于对话式视频业务来说,由于实时性要求高,而且I帧刷新的频率较低,因此可以用帧内编码块来部分代替I帧的作用。H.264/AVC提供了两种帧内编码块刷新(intrablockrefreshing)模式;其中,一种是随机模式,即用户可以选择帧内编码块的数目,而由编码器随机决定哪些哪些位置上的宏块实行帧内编码;另一种是行刷新模式,即编码器在图像中依次选择一行进行帧内编码,但图像分辨率大小不同,每次需要帧内编码块的数目也不同,例如在QCIF格式图像中,每次需要选择一行,即11个宏块进行帧内编码,而在CIF格式图像中,这个数字变成22。

1.4参数集(ParameterSets)H.264标准中,取消了序列层和图像层,将原本属于序列和图像头部的大部分句法元素分离出来形成序列参数集SPS(SequenceParameterSet)和图像参数集PPS(PictureParame2terSet)。序列参数集包括了与一个图像序列有关的所有信息,如编码所用的档次和级别、图像大小等,应用于视频序列。图像参数集包含了属于一个图像的所有片的信息,如嫡编码方法、FMO,宏块到片组的映射方式等,应用视频序列中的一个或多个独立的图像。多个不同序列参数集和图像参数集被解码器正确接收后,被存储于不同的己编码位置,解码器依据每个己编码片的片头的存储位置选择合适的图像参数集来使用。

1.5冗余片(RedundantSlice)H.264编码器除了对片内的宏块进行一次编码外,还可以采用不同的编码参数对同一个宏块进行一次或多次编码,生成冗余片,冗余片的信息也被编码进同一个视频流中。解码器在能够使用主片的情况下会抛弃冗余片,反之如果主片丢失,也可以通过冗余片来重构质量。

1.6灵活的宏块排序(FMO)FMO技术通过片组(slicegroup)技术来实现。片组是由一个或者多个片组成,而每个片中通常包括一系列的宏块。采用FMO进行视频编码的好处在于,可以使因信道传输而引起的错误分散。具体实施方法是:帧图中的宏块可以组成一个或几个片组,每一个片组单独传输,当一个片组发生丢失时,可以利用与之临近的已经正确接收到的另一片组中的宏块进行有效的错误掩盖。片组组成方式可以是矩形方式或有规则的分散方式(例如,棋盘状),也可以是完全随机的分散方式。采用FMO提高了码流的容错能力,却使编码效率有所降低,同时也会增加编码延迟时间。公务员之家

二、结论

通信技术的飞速发展,第三代数字无线移动通信网络以及多媒体信息服务(MMS)的兴起为无线移动环境下的多媒体通信业务(特别是视频)提供了应用和发展的需求.多媒体业务是3G的基本业务之一,然而视频通信业务对3G网络还是一种挑战,这是由于无线网络是一种易错网络,容易受到多径干扰、阴影衰落等多种条件的影响,致使视频传输流中的RTP包会大量丢失,因此对于3G无线网络中的视频通信业务,容错技术是不容忽视的。H.264/AVC视频编码标准本身提供了许多容错工具,可以很好的解决易差错信道的视频容错传输,提高3G视频通信的可用性。

参考文献:

[1]潘全卫.DHCP服务器容错方案[J].网管员世界.2009.(5):55-56.

容错技术范文篇5

1容错服务器的构成

一台容错服务器由完全相同的上下两片硬件组成,上下两片由内部IO总线连接,对用户使用来说就相当于一台单机,日常维护简单,一台机器实现了双机热备份的功能,并且可靠性更高,任何一个硬件故障都不会引起系统中断及数据丢失,保证系统与数据的连续可用性。每片硬件由其独立的主板、CPU、内存、硬盘及外设接口,实现了真正意义上的硬件全冗余技术,实现了任意硬件故障不停机目标。

2容错服务器的工作原理

容错服务器的磁盘冗余是通过磁盘同步镜像的方式实现的,镜像又分为逻辑层面镜像和物理层面的镜像,逻辑层面镜像的是磁盘的元数据,包括磁盘分区表等一系列配置信息,而物理层面镜像的是每一个相对应的物理扇区做镜像同步。在镜像同步时,是从主模块单元的磁盘同步到待机运行的从模块单元的磁盘,当服务器加电后,只有主模块单元的启动按钮灯点亮,而从模块单元灯是不点亮的。此时,按下启动按钮,服务器开始运行后系统检测无误后磁盘同步自动进行,如果想要切换主从模块,只需要将主模块单元电源断电30s之后再通电,服务器就会自动完成主从模块切换。所谓的磁盘物理镜像,也就是我们通常所说的RAID1,在容错服务器的两个模块单元中,在相同位置的磁盘做RAID1,如图2所示,每一个模块单元中都有三个磁盘插槽,从上到下编号分别为1、2、3,我们必须在相同位置的磁盘上做同步镜像,主盘与从盘一一对应,并且主盘与它所对应的从盘大小、型号必须完全相同,仅仅1M的误差就能够导致同步失败,所以容错服务器的硬盘一般都是厂家定制版。在容错服务器设计理念中,为了能够实现系统的全面整体容错功能,以及级别更高的数据安全性,在日常使用中建议对所有的磁盘都做磁盘镜像同步。当服务器完成磁盘同步后,每一个模块单元都可以看作是彼此的实时复制克隆,包括磁盘上的系统系统配置与全部数据,主从模块单元都保持完全一致。

3容错服务器的日常维护

3.1容错服务器的在线切换。容错服务器在运行时,服务器管理软件时刻监控着各个硬件的运行及健康状态,当某一个硬件出现故障不能工作时,系统通过软件自动切换到从服务器工作,而此时从服务器磁盘中的数据是和主服务器完全同步的,所以能够实现系统的不间断运行,一旦主从服务器切换,磁盘同步会立马停止(无论是否为磁盘故障),磁盘灯会变成闪黄灯。此时应该在检修时择机修复故障并恢复磁盘同步。3.2容错服务器的备份与恢复。当容错服务器的磁盘处于同步镜像后,写入数据时将同时写入镜像组中的两个磁盘,可在线拔出其中某块磁盘,而不会影响系统正常运行。当拔出的磁盘30min内重新插入到原插槽后,系统会自动进行增量同步,同步时间视磁盘单份运行时间内修改数据大小而定。利用这个属性,在修改程序之前可以将从盘拔出备份,一旦在线系统因程序修改失败出现故障,可以用备份的磁盘恢复修改前的程序继续生产,可以大大提高程序修改的可靠性,大大缩短故障时间。

容错技术范文篇6

关键词:3G视频通信H.264/AVC容错技术

传统的视频编码标准都是围绕比特流的概念组织的。实际上用于传送数字视频的大多数网络体系结构并不适合直接传输比特流。在许多网络体系结构中,比特流需要拆分为数据分组。这些分组的特性,如最小/最大尺寸、相关开销和差错属性等在网络体系结构间、甚至在某个给定的网络体系结构内也是很不相同的。假如视频编码器自身能和网络特性很好的匹配,将能够获得更好的视频QoS。问题是如何容错地支持易差错的无线移动网络?为了解决无线移动信道视频的容错传输,我们将采用如前向纠错编码及支持差错复原的视频压缩编码技术来解决。H.264编解码器可以很好的解决易差错信道的视频容错传输。在3GPP/3GPP2的传输环境下通过选择适当的条带长度使H.264编解码器和无线移动信道的网络特性得到很好的匹配,实现无线移动信道视频的容错传输。H.264标准适用于无线网络传输的主要原因之一就是在概念上分为两层:视频编码层VCL(VideoCodingLayer)和网络抽象层NAL(NetworkAbstractionLayer),其中VCL负责高效的视频内容表示,它被设计成尽可能独立的网络,NAL负责对编码信息进行打包封装并通过指定网络进行传输。H.264中还定义了两种新的帧编码类型,即SP帧和SI帧来完成不同流的切换,可以根据传输网络和用户终端的具体情况自适应地在不同码率的视频流之间切换,这大大改善了视频流对3G网络的适应性。

一、3G视频通信中容错技术的应用

3G通信技术的出现使对话式无线视频业务成为可能,虽然3G网络在移动环境下的带宽可达384kbps,在静止环境下的带宽可以达到2Mbps,但是由于信道衰减、建筑物遮挡、终端移动、多用户干涉等原因影响,使得信道是时变且高误码的,因此,在3G网络上传输视频流时,仅仅追求高的压缩效率是不够的,必须有一定的容错和错误掩盖措施。最新的3GPP/3GPP2标准要求3G终端支持H.264/AVC视频编解码技术,同时由于硬件的限制,3G终端只支持部分H.264/AVC的容错工具。H.264中虽然提供了一些容错工具,但是它们有各自不同的用途和目的,即在不同的场合需要选择不同的组合来使用。

1.1错误隐藏技术由于错误隐藏技术能够利用接收到的数据来恢复丢失的数据,因此一般都应用在解码器端。在无线网络环境中,解码器的这种能力尤其重要,因为无线网络环境中误码率高,很多RTP包在传输中被网关或者路由器丢弃,而这些丢失的数据又必须在解码器端根据空间和时间上的相关性来恢复。错误隐藏技术的实现方法也很多,在JVT参考软件中,就使用了一种空间相关性的方法,即使用被丢失宏块周围的4个宏块来恢复被丢失的数据,其选用的标准是使恢复后边缘数据的SAD(sumofabsolutedifference)差最小。这种方法的效果虽不是最好,但是计算简单有效。

1.22Slice结构为了满足MTU大小的要求,在3G网络视频传输中对视频进行分片压缩显得尤其重要。经过分片压缩后的视频中每个RTP包中包含一个片,一般每个slice中包含一个或者几个宏块,并以RTP包的大小满足MTU的要求为准。

1.3帧内编码块刷新由于帧内编码不依赖时间上相邻帧的数据,所以帧内编码块能有效地阻止由于包丢失甚至帧丢失而引起的错误传播。对于对话式视频业务来说,由于实时性要求高,而且I帧刷新的频率较低,因此可以用帧内编码块来部分代替I帧的作用。H.264/AVC提供了两种帧内编码块刷新(intrablockrefreshing)模式;其中,一种是随机模式,即用户可以选择帧内编码块的数目,而由编码器随机决定哪些哪些位置上的宏块实行帧内编码;另一种是行刷新模式,即编码器在图像中依次选择一行进行帧内编码,但图像分辨率大小不同,每次需要帧内编码块的数目也不同,例如在QCIF格式图像中,每次需要选择一行,即11个宏块进行帧内编码,而在CIF格式图像中,这个数字变成22。

1.4参数集(ParameterSets)H.264标准中,取消了序列层和图像层,将原本属于序列和图像头部的大部分句法元素分离出来形成序列参数集SPS(SequenceParameterSet)和图像参数集PPS(PictureParame2terSet)。序列参数集包括了与一个图像序列有关的所有信息,如编码所用的档次和级别、图像大小等,应用于视频序列。图像参数集包含了属于一个图像的所有片的信息,如嫡编码方法、FMO,宏块到片组的映射方式等,应用视频序列中的一个或多个独立的图像。多个不同序列参数集和图像参数集被解码器正确接收后,被存储于不同的己编码位置,解码器依据每个己编码片的片头的存储位置选择合适的图像参数集来使用。

1.5冗余片(RedundantSlice)H.264编码器除了对片内的宏块进行一次编码外,还可以采用不同的编码参数对同一个宏块进行一次或多次编码,生成冗余片,冗余片的信息也被编码进同一个视频流中。解码器在能够使用主片的情况下会抛弃冗余片,反之如果主片丢失,也可以通过冗余片来重构质量。

1.6灵活的宏块排序(FMO)FMO技术通过片组(slicegroup)技术来实现。片组是由一个或者多个片组成,而每个片中通常包括一系列的宏块。采用FMO进行视频编码的好处在于,可以使因信道传输而引起的错误分散。具体实施方法是:帧图中的宏块可以组成一个或几个片组,每一个片组单独传输,当一个片组发生丢失时,可以利用与之临近的已经正确接收到的另一片组中的宏块进行有效的错误掩盖。片组组成方式可以是矩形方式或有规则的分散方式(例如,棋盘状),也可以是完全随机的分散方式。采用FMO提高了码流的容错能力,却使编码效率有所降低,同时也会增加编码延迟时间。公务员之家

二、结论

通信技术的飞速发展,第三代数字无线移动通信网络以及多媒体信息服务(MMS)的兴起为无线移动环境下的多媒体通信业务(特别是视频)提供了应用和发展的需求.多媒体业务是3G的基本业务之一,然而视频通信业务对3G网络还是一种挑战,这是由于无线网络是一种易错网络,容易受到多径干扰、阴影衰落等多种条件的影响,致使视频传输流中的RTP包会大量丢失,因此对于3G无线网络中的视频通信业务,容错技术是不容忽视的。H.264/AVC视频编码标准本身提供了许多容错工具,可以很好的解决易差错信道的视频容错传输,提高3G视频通信的可用性。

参考文献:

[1]潘全卫.DHCP服务器容错方案[J].网管员世界.2009.(5):55-56.

容错技术范文篇7

关键词:机电一体化仿真容错纠错

一、引言

现代机电产品正朝着集成化、自动化、智能化的方向发展,有的机电产品对人的依赖性越来越小,发生故障根本不可能由人去维修,有的机电产品形成大系统,一旦发生故障可能导致重大事故,并造成巨大经济损失。例如:美国发射的“勇气”号火星车和“机遇”号火星车,在太空飞行半年之久,一旦有了故障靠人去诊断和维修是根本不可能的;2008年8月巴西一枚VLS-3型卫星运载火箭,在接受最后检测时突然爆炸,导致现场21人被炸死,另有20多人身受重伤。

这些集成化、自动化、智能化的机电系统发生故障的随机性很强,往往难以预料,但工程实践表明除了少数突发故障以外,大多数故障是一个渐进的过程。如果早期发现,及时采取恰当的措施是完全可以防止的,机电产品容错纠错设计与仿真技术研究以及容错技术的应用正是顺应了这种需求。

容错技术为提高系统的可靠性开辟了一条新的途径。虽然人们无法保证所设计的系统各个构成环节的绝对可靠,但若把容错的概念引入到机电产品,可以使各个故障因素对产品性能的影响被显著削弱,这就意味着间接地提高了产品的可靠性。研究和应用容错技术,对于保障机电系统运行的连续性和安全性,减少安全事故,提高现代机电产品的经济效益和社会效益,具有非常重要的意义。

二、仿生硬件容错研究现状

随着电路系统功能的复杂化,传统的硬件容错技术越来越不能满足日益庞大的电路系统要求。为了提高系统可靠性,人们提出了动态地对故障进行自检测、自修复的要求,并努力寻找新的容错设计方法。早在20世纪50年代末,计算机之父冯•诺依曼就提出了研制具有自繁殖与自修复能力通用机器的伟大构想。

研究人员从自然界得到灵感,将自然计算(如进化计算,胚胎理论等)引入到硬件设计中从而形成仿生硬件(Bio-inspiredHardware,BHW)。仿生硬件的概念最初是由瑞士联邦工学院于1992年提出的,虽然历史不长,但其发展非常迅速,现在已经成为国际上的研究热点之一。仿生硬件早期也称为进化硬件(EvolvableHardware,EHW)。A.Thompson等人较早提出了EHW应用于容错方面的想法。仿生硬件是一种能根据外部环境的变化而自主地、动态地改变自身的结构和行为以适应其生存环境的硬件电路,它可以像生物一样具有硬件自适应、自组织、自修复特性。采用仿生硬件实现的容错,不需要显式冗余,而是利用进化本身固有容错的特性,这种特性带来的优势是传统方法通过静态冗余实现容错所不能比拟的。

三、仿生硬件的容错技术新思路

基于仿生硬件的容错研究,对建立借鉴生物进化机制的硬件容错新理论、新模型和新方法,提高硬件系统的可靠性,具有至关重要的意义。

(一)胚胎型仿生硬件的容错体系结构和容错原理

仿生硬件可以分为进化型和胚胎型,其中胚胎型仿生硬件也称为胚胎电子系统,是模仿生物的多细胞容错机制实现的硬件。

胚胎型仿生硬件的容错体系结构,主要由胚胎细胞、开关阵和线轨组成。开关阵根据可编程连线的控制信号完成开关闭合,控制线轨内各线段的使用。胚胎细胞包含存储器、坐标发生器、I/O换向块、功能单元、直接连线、可编程连线、控制模块等。存储器用于保存配置数据位串,并根据细胞状态和坐标发生器计算出的结果,从配置位串中提取一段经译码后对胚胎电子细胞的换向块和功能单元进行配置。坐标发生器根据每个细胞最近两侧(左侧和下侧)邻居细胞的坐标为其分配坐标。I/O换向块为细胞功能单元间的可编程连线提供控制信号。功能单元用于实现一个n输入的布尔函数,用于实现所需的细胞功能。直接连线负责功能单元之间的相互通信。可编程连线传递控制信号控制开关阵。控制模块完成细胞的工作状态检测、故障诊断、控制细胞冗余切换。

(二)胚胎型仿生硬件实现容错的策略

为了实现对故障细胞的容错,常用的容错策略有两种:行(列)取消和细胞取消策略,通过记录有错的单元位置,重新布线,用其他备用的单元来代替。

但是对于连线资源故障,这些策略并未给出相应的对策。在深入研究胚胎仿生硬件容错体系结构的基础上,本文提出一种针对线轨故障的容错策略。

1.行(列)取消策略。在行(列)取消中,若一个细胞出错,则它所在行(列)的所有细胞都将被取消,而该行(列)细胞的功能将被其上一行(右一列)的细胞所代替,即当一个细胞出错时,细胞所在行(列)上移(右移)到一个备用行(备用列)来代替它当前的工作。公务员之家

2.细胞取消策略。在细胞取消中,用备用细胞代替故障细胞分两个阶段。当某一行的出错细胞数超过备用细胞数时,整行被取消,行细胞上移,用备用行取代出错行的功能。

(三)胚胎型仿生硬件实现容错的流程

胚胎型仿生硬件容错的流程为:

(1)根据设计需求选择器件,确定硬件设计方案;

(2)以电路结构及有关参数等作为染色体进行编码,按照进化算法的进化模式对系统进行进化操作;

(3)一般以电路的功能与预期结果的符合程度作为个体的适应度。根据给定的输入条件或测试集,通过基于电路模型的仿真测试或实测计算群体中的每个个体的适应度;

(四)胚胎型仿生硬件内部错误检测机制

错误检测是胚胎型仿生硬件实现容错的前提,本文在此着重研究针对细胞故障的错误检测机制。

基于细胞功能单元的三模冗余与多数表决器电路实现是硬件容错常用的冗余容错策略。

多数表决器判断输出多数细胞模块的信号,但并不能判断出具体哪个细胞出现了错误,也就没法启动对出错细胞的重启动或重构来修复该细胞。为了能检测出错细胞的具体位置,从而修复该细胞,进一步提高三模冗余的可靠性,需要设计相应的差错检测器。

参考文献:

[1]高金吉,装备系统故障自愈原理研究.中国工程科学,2009(5).

容错技术范文篇8

关键词:机电一体化仿真容错纠错

一、引言

现代机电产品正朝着集成化、自动化、智能化的方向发展,有的机电产品对人的依赖性越来越小,发生故障根本不可能由人去维修,有的机电产品形成大系统,一旦发生故障可能导致重大事故,并造成巨大经济损失。例如:美国发射的“勇气”号火星车和“机遇”号火星车,在太空飞行半年之久,一旦有了故障靠人去诊断和维修是根本不可能的;2008年8月巴西一枚VLS-3型卫星运载火箭,在接受最后检测时突然爆炸,导致现场21人被炸死,另有20多人身受重伤。

这些集成化、自动化、智能化的机电系统发生故障的随机性很强,往往难以预料,但工程实践表明除了少数突发故障以外,大多数故障是一个渐进的过程。如果早期发现,及时采取恰当的措施是完全可以防止的,机电产品容错纠错设计与仿真技术研究以及容错技术的应用正是顺应了这种需求。

容错技术为提高系统的可靠性开辟了一条新的途径。虽然人们无法保证所设计的系统各个构成环节的绝对可靠,但若把容错的概念引入到机电产品,可以使各个故障因素对产品性能的影响被显著削弱,这就意味着间接地提高了产品的可靠性。研究和应用容错技术,对于保障机电系统运行的连续性和安全性,减少安全事故,提高现代机电产品的经济效益和社会效益,具有非常重要的意义。

二、仿生硬件容错研究现状

随着电路系统功能的复杂化,传统的硬件容错技术越来越不能满足日益庞大的电路系统要求。为了提高系统可靠性,人们提出了动态地对故障进行自检测、自修复的要求,并努力寻找新的容错设计方法。早在20世纪50年代末,计算机之父冯•诺依曼就提出了研制具有自繁殖与自修复能力通用机器的伟大构想。

研究人员从自然界得到灵感,将自然计算(如进化计算,胚胎理论等)引入到硬件设计中从而形成仿生硬件(Bio-inspiredHardware,BHW)。仿生硬件的概念最初是由瑞士联邦工学院于1992年提出的,虽然历史不长,但其发展非常迅速,现在已经成为国际上的研究热点之一。仿生硬件早期也称为进化硬件(EvolvableHardware,EHW)。A.Thompson等人较早提出了EHW应用于容错方面的想法。仿生硬件是一种能根据外部环境的变化而自主地、动态地改变自身的结构和行为以适应其生存环境的硬件电路,它可以像生物一样具有硬件自适应、自组织、自修复特性。采用仿生硬件实现的容错,不需要显式冗余,而是利用进化本身固有容错的特性,这种特性带来的优势是传统方法通过静态冗余实现容错所不能比拟的。

三、仿生硬件的容错技术新思路

基于仿生硬件的容错研究,对建立借鉴生物进化机制的硬件容错新理论、新模型和新方法,提高硬件系统的可靠性,具有至关重要的意义。

(一)胚胎型仿生硬件的容错体系结构和容错原理

仿生硬件可以分为进化型和胚胎型,其中胚胎型仿生硬件也称为胚胎电子系统,是模仿生物的多细胞容错机制实现的硬件。

胚胎型仿生硬件的容错体系结构,主要由胚胎细胞、开关阵和线轨组成。开关阵根据可编程连线的控制信号完成开关闭合,控制线轨内各线段的使用。胚胎细胞包含存储器、坐标发生器、I/O换向块、功能单元、直接连线、可编程连线、控制模块等。存储器用于保存配置数据位串,并根据细胞状态和坐标发生器计算出的结果,从配置位串中提取一段经译码后对胚胎电子细胞的换向块和功能单元进行配置。坐标发生器根据每个细胞最近两侧(左侧和下侧)邻居细胞的坐标为其分配坐标。I/O换向块为细胞功能单元间的可编程连线提供控制信号。功能单元用于实现一个n输入的布尔函数,用于实现所需的细胞功能。直接连线负责功能单元之间的相互通信。可编程连线传递控制信号控制开关阵。控制模块完成细胞的工作状态检测、故障诊断、控制细胞冗余切换。

(二)胚胎型仿生硬件实现容错的策略

为了实现对故障细胞的容错,常用的容错策略有两种:行(列)取消和细胞取消策略,通过记录有错的单元位置,重新布线,用其他备用的单元来代替。

但是对于连线资源故障,这些策略并未给出相应的对策。在深入研究胚胎仿生硬件容错体系结构的基础上,本文提出一种针对线轨故障的容错策略。

1.行(列)取消策略。在行(列)取消中,若一个细胞出错,则它所在行(列)的所有细胞都将被取消,而该行(列)细胞的功能将被其上一行(右一列)的细胞所代替,即当一个细胞出错时,细胞所在行(列)上移(右移)到一个备用行(备用列)来代替它当前的工作。

2.细胞取消策略。在细胞取消中,用备用细胞代替故障细胞分两个阶段。当某一行的出错细胞数超过备用细胞数时,整行被取消,行细胞上移,用备用行取代出错行的功能。

(三)胚胎型仿生硬件实现容错的流程

胚胎型仿生硬件容错的流程为:

(1)根据设计需求选择器件,确定硬件设计方案;

(2)以电路结构及有关参数等作为染色体进行编码,按照进化算法的进化模式对系统进行进化操作;

(3)一般以电路的功能与预期结果的符合程度作为个体的适应度。根据给定的输入条件或测试集,通过基于电路模型的仿真测试或实测计算群体中的每个个体的适应度;公务员之家

(四)胚胎型仿生硬件内部错误检测机制

错误检测是胚胎型仿生硬件实现容错的前提,本文在此着重研究针对细胞故障的错误检测机制。

基于细胞功能单元的三模冗余与多数表决器电路实现是硬件容错常用的冗余容错策略。

多数表决器判断输出多数细胞模块的信号,但并不能判断出具体哪个细胞出现了错误,也就没法启动对出错细胞的重启动或重构来修复该细胞。为了能检测出错细胞的具体位置,从而修复该细胞,进一步提高三模冗余的可靠性,需要设计相应的差错检测器。

参考文献:

[1]高金吉,装备系统故障自愈原理研究.中国工程科学,2009(5).

容错技术范文篇9

一、计算机网络可靠性定义

计算机网络在规定的条件下,规定的时间内,网络保持连通和满足通信要求的能力,称之为计算机网络可靠性。它反映了计算机网络拓扑结构支持计算机网络正常运行的能力,是计算机网络规划、设计与运行的重要参数之一。

二、计算机网络可靠性的设计原则

在计算机网络设计和建设的工程实践中,科研人员总结了不少具体的设计经验和原则,对计算机网络可靠性的优化设计起到了较好的规范和指导作用。在构建计算机网络时应遵循以下几点原则:(1)遵循国际标准,采用开放式的计算机网络体系结构,从而能支持异构系统和异种设备的有效互连,具有较强的扩展与升级能力。(2)先进性与成熟性、实用性、通用性相结合,选择先进而成熟的计算机网络技术,选择实用和通用的计算机网络拓扑结构。(3)计算机网络要具有较强的互联能力,能够支持多种通信协议。(4)计算机网络的安全性、可靠性要高,具有较强的冗余能力和容错能力。(5)计算机网络的可管理性要强,应选择先进的网络管理软件和支持SNMP及CMIP的网络设备。(6)应选择较好的计算机网络链路的介质,保证主干网具有足够的带宽,使整个网络具有较快的响应速度。(7)充分利用现有的计算机网络资源,合理地调配现有的硬件设施、网络布线、已经成熟的网络操作系统软件和网络应用软件。(8)计算机网络可靠性设计的性价比应尽可能高。

三、计算机网络可靠性优化策略

从上述情况来看,计算机网络可靠性的优化主要依赖于两个要素,即在考虑成本等外在因素影响条件下,一方面尽可能采用自身可靠性较高的相关设备,另一方面在组网过程中尽可能采用冗余技术。具体的优化策略可从以下几个方面入手:

1、计算机网络容错性优化策略计算机网络可靠性优化的首要方面在于容错性优化。容错性优化的要诀在于双网并立、干线并行。计算机网络在进行容错性优化时一般应达到以下几点;(1)局域网互联方面。在本网络中建立两个网络中心,使之并立运行,将包括路由器、服务器、终端设备等网络组件同时与两者相连接。(2)广域网互联方面。建立多条数据链路、多个路由的连热插热拨功能的网络设备,因为在发生故障时切断该设备电源进行维护的话,将使该网络节点彻底断开,可能会造成大面积的影响。如果选择了具有模块化结构、热插热拨功能的网络设备,可以根据需要选择相应模块,节约建设成本,在维护过程中不必切断电源,使得该设备完好的部分功能得以继续发挥,无形中提高了计算机网络工作时长,从而使整个计算机网络的容错能力得到优化。另一方面,对于一些提供网络服务的设备如服务器,应同时采用如双机热备份、双机镜像、容错存储等其他技术,多角度优化本网络的容错性。(3)网络管理软件选择方面。软件在计算机网络容错性优化方面所起到的作用也是不能忽视的,在选择合适的网络管理软件时,应考虑采用具有容错功能的网络操作系统来提供故障恢复机能,协同网络设备工作。

2、双网络冗余优化策略在容错性优化中提到的双计算机网络中心,其实质就是双网络冗余,也就是说在原有的计算机网络的基础上再增加一个备用网络,形成双网并立结构,以网络冗余实现网络容错。其工作原理是,各个网络节点之间通过双网络相连,当某个结点需要向其它结点传送信息时,能够通过双网络中的任意一个实施信息传送。在考虑双网络冗余优化时,可以在双网络均可正常工作的情况下实施双网络同时传送,这样在避免资源浪费的同时极大提高网络的工作效能。而当其中一个网络发生故障不能正常工作时,另一个网络能够迅速接替故障网络承担起全网络的工作,保证了信息的可靠传递,从而提高了该网络的整体可靠性。

3、计算机网络层次结构优化策略计算机网络的性能除了受到设备、线路等因素的影响外,网络层次结构也发挥着举足轻重的作用。网络层次结构的合理与否直接影响到网络中各组件性能的发挥。随着计算机网络技术的不断革新、计算机网络信息传输量的日益增长,更出现了模块化的网络层次结构,即多层网络结构。它能够最大程度地利用OSI(OpenSystemInterconnection)模型第三层即网络层((Network)的相应功能,即为信息传输创建逻辑链路、选择最适当的路径,实现拥塞控制,保持网络互联畅通,提高了工作效率和可靠性。另外,多层网络结构能够对故障实行有效隔离并支持所有常用的网络协议,方便了进行维护和故障的查找与排除。

容错技术范文篇10

关键词多链路ISPBGPHSRPARP

基于计算机网络的应用在快速发展,各企事业单位对其INTERNET接入线路的带宽以及性能的要求越来越高,这使得大多数企事业单位都对原来的INTERNET接入方案做出了相应的调整。有的为增加出口带宽而增加多条INTERNET接入线路,有的为增加接入线路的容错能力而增加多条INTERNET接入线路;但在调整过程中很多企业都遇到当采用多条线路接入到INTERNET,尤其是通过多个不同的ISP接入INTERNET时,如何进行负载均衡,以及如何进行容错等难以解决的问题。

以下就针对同一ISP的多链路接入以及多ISP的多链路接入的问题进行分析和讨论。

1通过同一ISP的多链路接入

1.1用不同的ROUTER通过同一ISP接入到INTERNET

1.1.1用Multilink实现容错及负载均衡

当用单一ROUTER的多端口用多条线路通过同一ISP接入INTERNET,可采用MULTILINK技术,将多条接入线路在逻辑上捆绑在一起,在使用过程中被当成一条线路。当有数据要通过该线路传输时,数据包被分成等大小的多块同时在多条线路上传输,以加快传输速度,当数据到达另一端时再被从新组装在一起,还原为原始的数据包,以达到加快数据传输的目的;当其中一条物理线路坏掉时,其它的线路自动维持正常的数据传输,只是逻辑通道的总带宽减少了一些,这样也就避免了单条线路的失败导致整个网络中断的问题。在这种技术中要求ISP也是用的同一台ROUTER。

1.1.2应用动态路由协议实现负载均衡与容错

在互联网上常用的协议有BGP、IGRP、EIGRP、OSPF等。其中IGRP,EIGRP协议为CISCO私有的路由协议,如果采用他们可以在不等代价的路径上进行负载平衡,如一条带宽为2M,一条为1M,那么在两条链路上的传输的数据的实际比例为2:1,即三个数据包中,有两个从2M的线路走,一个从1M的线路走,这样使得线路可以充分合理的应用;而对其它的一些协议只能在等价的路径上进行负载平衡,在实际应用中受到一定的限制,当然为解决这类问题也可以通过策略来实现负载分担。同时由于采用的是动态路由协议,如果其中一条线路坏掉,路由协议会自动的将所有的数据转到正常的线路上继续传输,也就实现容错的目的。当然这种方式也可以在多ROUTER的环境中使用。

1.1.3端口备份

当用一个ROUTER的多个端口连到互联网时也可以采用BACKUP命令进行端口备份,在正常情况下使用主链路,当主链路坏掉时,起用备份端口,这样比较适合于用拨号线路来备份园区网的接入专线,保证网络的可用性。也可用LOAD命令以进行负载均衡,当主链路的流量达到一定的值时,起用第二条线路进行负载分担。

1.2采用多ROUTER通过多ISP接入到INTERNET

1.2.1应用ROUTER的ARPPROXY功能实现容错及负载均衡

将所有连到INTERNET的多台ROUTER的本地端口配置为允许ARPPROXY,以监视客户的ARP请求,如何让客户机在与其它网络上机器通讯时直接发ARP广播。以下就以MICROSOFTWINDOWS为例说明,为达到其目的将WINDOWS的网关设为自己的IP地址,如IP地址为192.168.1.1的PC机的网关为192.168.1.1,当客户有查询本地网络以及以外其它网络上主机的MAC地址的ARP请求时,由ROUTER做出响应,然后将用户的数据报传输到INTERNET。对于客户机不必知道真正的网关,这样多台ROUTER便可进行负载分担,以及容错。

1.2.2在客户机上配置多网关以实现容错及负载均衡

当通过多台ROUTER连到INTERNET时,可在PC机上设多个网关,`当配在前面网关出现故障变得不可用时,PC机将自动依次用配在后面的网关。为进行负载分担应将不同的机器上的网关的顺序设为不一样的,以使得每一条线路在正常时都得到充分的应用。

1.2.3应用CISCO的HSRP实现负载均衡与容错

当有多台路由器连到INTERNET时,可以将多台路由器连接同一LAN的端口放在同一个热备份组中,对外用一个虚拟的IP地址,隐藏热备份组中各台ROUTER真实的IP,当ACTIVEROUTER失败时,其它的ROUTER自动变为ACTIVE,担当起路由LAN数据包的任务,这样多台路由器之间可以相互备份进行容错。同时也可以配置多个热备份组,在不同的方向上用不同热备份组,通过设置不同的优先级使在不同的热备份组中活跃ROUTER不一样,以实现不同的ROUTER进行负载均衡。

1.2.4IRDP实现容错

ICMP路由发现协议,是将出口的多台ROUTER的对本地的端口的IRDP的优先级设为不一样,客户机通过对ROUTER的查询以及ROUTER的应答及宣告知道哪一个的级别高,使用优先级别高的作为网关,当级别高的出现故障不可用时,再使用级别低的,以实现容错。

2.通过不同的ISP多链路接入INTERNET

对于不同ISP的多链路接入在目前来说也开始出现,但由于技术上的原因,使得其应用并不普及。本文的以下部分就在其应用过程中遇到的问题进行详细的分析,并提出合适的解决办法。

现有某园区网,原有一条线路通过ISP1接入INTERNET。随INTERNET应用的增加,在使用过程中发现对ISP1以外的网络访问非常慢,为此增加了一条另一条接入线路,通过ISP2接入INTERNET,以加速对ISP2的网络的访问,同时也加快对其它网络的访问速度。如下图:

负载分担的具体要求如下:

A.到ISP1的数据由连到ISP1的接入线路L3出,返回的数据依然由接到IPS1的线路L3回;到ISP2及其它网络的数据由接入到连到ISP2的线路L4出,返回的任由接入到ISP2的线路L4回。

B.同时也希望ISP1上的客户如果要访问园区网上的SERVER时,由接到ISP1的接入线路L3进,SERVER对客户的响应由接到ISP1的接入线路L3回;同样ISP2及其它网络上的客户如果要访问园区网的SERVER时,由接到ISP2的接入线路L4进,SERVER对客户的响应也由接到ISP2的接入线路L4回。

解决办法:

A.由内到外

数据出去的时候很容易解决:只需简单地在R1上配路由分别从两个出口出,到ISP1的数据由第一条L1出,到其它网络的数据由第二条链路L2出,但同时也要在R1上配两条分别指向R2与R3的高管理距离缺省路由,以便L1或L2失败时进行容错;而对返回的路由却不能控制,一般情况下,如果内部用户用的是ISP1的地址将全部由连到ISP1的链路L3返回,如果用的是ISP2的地址将全部由连到ISP2的链路L4返回。要解决该问题只有通过修改用户数据包离开园区网时的源地址,访问ISP1时用从ISP1分到的IP;访问IPS2及其它网络时用从ISP2分到的IP地址,具体就分别在R2及R3上采用NAT技术来实现。

B.由外到内

为保证内部的SERVER能被外部的客户访问,就要在两个NATSERVERR2及R3上为内部的SERVER做静态的映射。以下就进出分别讨论。

数据包进入园区网:如果SERVER采用ISP1地址则所有的访问将全部由接到ISP1的接入线路进,如果采用ISP2分配的IP地址数据报将全由到ISP2的接入线路进,要解决必须给服务器分配多个IP地址分别为从各个ISP分配的。同时在DNS的服务器上,启用子网掩码优先使得从ISP1来的客户的从DNS服务器上得到内部SERVER从ISP1分得的IP地址,从ISP2来的客户从DNS服务器上得到内部SERVER从ISP2分得的地址,这样便可使得不同网络的客户都由相应的线路进或出。数据包离开园区网:通过配静态及缺省路由解决,与由内到外的出的数据一样,不需单独处理。

在以上的方法中,对于多ISP多链路接入的园区网,很好的解决了容错以及负载平衡的问题;但由于采用NAT技术增加数据在网络上的延时,一般要选择在性能好,有足够内存,以及足够快的处理器的ROUTER上来配NAT,以尽可能减少在NAT上进行地址转换所耗费的时间。

总之,当园区网采用多链路的远程接入方案时,根据具体情况可采用不同的方法解决网络的容错以及负载平衡。但由于不管哪种技术都会或多或少增加传输延时,要尽可能减少延时,一点就是要就要将多线路多ISP的接入方式用单一ISP的单一的高带宽的线路所取代,另一点就是使用性能稳定的线路及相关的网络设备,避免在链路转换上的延时,以使得网络更好地为各企事业单位所应用。

参考文献

〔1〕曹东启约瑟夫.帕列洛陈宇。《网络典型案例分析》《网络设计基础》北京希望出版社2000年。

〔2〕JeffDoyle。TCP/IP路由技术卷一卷二。清华大学出版(影印版)