气象基层台站网络故障处理探讨

时间:2022-10-09 09:07:22

气象基层台站网络故障处理探讨

气象部门现行的观测数据传输规则是:市、县两级收集到的观测数据在规定的时间内传至省局,省局再统一打包传至国家局。在过去的地面气象观测业务工作中,一旦发生网络故障,观测台站的业务人员可以通过打电话的形式将实况数据上报给省局,这样不会影响数据传输质量。随着地面气象观测业务自动化进程的加深,这种打电话报数据的处理方式已经不再适用,观测数据的考核方式也产生了改变,观测数据只能以报文的形式在规定时间内通过网络上传至省局入库,这就意味着传输网络的稳定运行,是当前数据传输质量的基本保障。本文以黄石站为例,针对日常地面气象观测业务运行中遇到的部分网络问题,提出了一些快捷有效的解决办法。

1黄石站的网络建设情况

黄石站现行的地面观测业务中,通讯主网络采用的是由湖北省气象局统一配备的核心交换机,运营商网络专线构成的内网线路。通过2条以上不同运营商的专用线路接入2台交换机再同时接入1台本站的核心交换机,核心交换机通过协议来实现负载均衡和双机热备的功能,当任意一条接入交换机的线路出现故障时,通过协议,核心交换机会自动选择另一条线路作为传输路径,很大程度上减少了因专线故障导致的网络传输失败[1]。这种双机热备的好处在于线路的切换是设定好的,投入运行以后无需人工干预,极大的满足了市县两级基层台站的业务需要。除了以上2条可切换的主线路,黄石站还配有1条普通的电信AD-SL线路作为备份线路,当主网络出现故障无法及时恢复时,可通过拨号上网的方式,通过VPN连接的方式将数据由备份线路传输到省局服务器。

2存在的问题

2.1人工插拔方式切换主线路和备份线路存在的问题。虽然双机热备的设定在很大程度上降低了网络传输失败率,但在实际业务运行中依然存在核心交换机宕机、两条接入交换机同时故障等一系列不可预知的问题。由于业务人员的技术水平不高,对计算机网络不够熟悉等原因,当发生网络故障的时候,定位故障点,查明故障原因存在一定困难,此时常用的解决办法就是重启交换机,然而现在黄石站所用的交换机设备往往需要5~10min才能重启完毕,还不一定行之有效。那么要保证在短时间内恢复网络装备保障数据的及时上传,就需要人工启动电信ADSL备份线路。以往的做法是,观测员将连接在电脑上的核心交换机端口拔掉,插上电信ADSL备份线路端口,然后拨号上网,再通过VPN将数据发送到省局。这样的做法存在以下问题:网线端口在拔插中容易发生损坏,会增加发生新故障的风险;电脑网线端口在电脑主机的背后,不便于操作,且部分观测员不能在众多端口中分辨出网口;备份线路长期不启用,电信运营商会在终端处直接注销备份线路账号,当主线路出现故障,启用备份线路时才发现账号被运营商注销,无法正常使用,需要等待2~6h才能恢复。以上原因,很容易导致在整点前后发生主网络故障时数据无法及时传输至省局,产生逾限报和缺报,直接影响台站数据传输质量。如果网络故障时间较长,还会影响很多其他气象业务的开展。这对台站业务质量考核极其不利。2.2串口服务导致的网络冲突问题。随着气象观测的自动化改革,观测场的设备逐渐增加,原有的数据传输方式,满足不了新增观测设备的数据传输,进而引入了串口服务器设备,将多个气象要素采集器和串口服务器相连接后,通过串口服务器将不同采集器采集到的同一时间的实时数据汇总处理,再通过光纤转换模块传送的综合观测业务电脑,这种新型的传输方式需要为串口服务器配置内网固定IP,并且应与采集器电脑的IP在同一网段内,才能保证综合观测业务电脑获取到采集器里的数据,再由综合观测业务电脑中的业务软件将这些实时气象数据转化成报文,通过核心交换机中设置好的线路传输至省局。但如果通讯主网络发生故障,启用备份线路时,如果不将综合观测业务电脑的网络设置改成自动获取,那么它本身还是内网固定IP则无法通过备份线路将报文传输到省局。如果通过设置IP让综合观测业务电脑从内网连接转换至外网网段,此时综合观测业务电脑可以连接外网,通过VPN协议将报文发送到省局,但由于此时的串口服务器配置的仍然是内网段IP,与综合观测业务电脑IP的网段不一致,导致此时综合观测业务电脑无法获得采集器里的实时气象数据,这将导致即使网络能够联通到省局服务器,但也无法将正确的气象数据传输到省局,且配置串口服务器需要专用的软件,在实际工作中存在一定困难,也不便于操作。通过咨询串口服务器厂家的建议认为可为综合观测业务电脑配置双网卡,来解决启用备份线路时由串口服务器导致的网络冲突问题,但实际工作中,即使为计算机配备了双网卡,因为存在内外网2个IP段的问题。技术人员还需要为计算机设置网路路径,来保障计算机可以同时访问内外网,对于基层台站来说,配置双网卡电脑在经费和技术方面设备网路路径都存在较大困难。

3解决办法

3.1ADSLMODEM。直连核心交换机和华为通讯模块针对上述问题,黄石站将核心交换机,串口服务器的通讯模块,综合观测业务电脑通过网线直接连接到电信备份线路ADSLMODEM的LAN口上,电信备份线路端口接入ADSLMODEM的WAN口。当主线路未发生故障的时候,不启用综合观测业务电脑上的拨号连接程序,此时的ADSLMODEM只启用其交换机功能,只起到连接串口服务器的通讯模块和核心交换机和综合观测业务电脑作用。当主线路出现故障时,观测员只需要直接启用采集器电脑上的拨号上网程序,此时ADSLMODEM启用了拨号上网功能,相当于启用了路由器功能,会自动分配数据包的路径,使综合观测业务电脑可以同时连通互联网和串口服务器,再将省局专门为VPN线路配置的USBKEY插入综合观测业务电脑,通过VPN软件使综合观测业务电脑能够通过外网连接省局服务器实现气象数据实时上传,整个操作时间在60s以内且不需要很强的技术性即可完成。便捷的操作使得台站可以更容易完成备份线路的网络传输应急演练,在电信运营商的后台数据中不会由于备份线路的网线处于长期空置状态而把它注销,即使线路被注销,基层台站也可以在演练中及时发现问题,避免真正故障的时候才发现问题。这种方式可有效解决2.1中提到的3个问题,且能跳过寻找网络故障发生点的步骤,大大降低了基层台站人员的计算机网络能力的要求,在基层台站实际工作中能有效的保障网络故障应急期间气象数据的传输质量,解决了过往网络故障发生后,备份线路启用不及时的问题。3.2其他建议。为了保证交换机的正常工作,机房应有良好的防尘措施,室温保持10~25℃。由于交换机和路由器是24h不间断工作,所以机房的空调也是24h不间断工作的,在夏天应注意空调的维护,不然极易发生因空调故障导致机房温度过高,交换机和路由器宕机。日常维护中建议:夏季气温高,应加强机房的巡视;一旦发生空调故障,应立即请维修人员上门维护,同时打开机房的门窗,以降低机房的温度;有条件的台站,可在机房配备温度监控报警装置,实时监控机房温度,及早发现问题。

参考文献

[1]李红英,田苗,尹育红.局域网故障的快速诊断与排除[J].新疆农垦科技,2018(4):48-50.

作者:柯凡 光辉 单位:黄石市气象局