容错服务器在热连轧生产技术的运用

时间:2022-08-08 10:02:26

容错服务器在热连轧生产技术的运用

热连轧生产技术属于各种高新技术应用最广泛的一类生产过程,特别是带钢热连轧计算机控制系统,是热连轧技术能够迅速、成熟发展的有力支撑,它不仅提高了生产效率,而且大大提高了热轧带钢产品的尺寸精度和性能。所以热连轧计算机控制系统的稳定性是热连轧生产线稳定运行的前提和保证,而容错服务器管理系统可以采用硬件冗余技术实现系统的高可靠性,并且故障切换时不会丢失当前任务,不会影响生产节奏。

1容错服务器的构成

一台容错服务器由完全相同的上下两片硬件组成,上下两片由内部IO总线连接,对用户使用来说就相当于一台单机,日常维护简单,一台机器实现了双机热备份的功能,并且可靠性更高,任何一个硬件故障都不会引起系统中断及数据丢失,保证系统与数据的连续可用性。每片硬件由其独立的主板、CPU、内存、硬盘及外设接口,实现了真正意义上的硬件全冗余技术,实现了任意硬件故障不停机目标。

2容错服务器的工作原理

容错服务器的磁盘冗余是通过磁盘同步镜像的方式实现的,镜像又分为逻辑层面镜像和物理层面的镜像,逻辑层面镜像的是磁盘的元数据,包括磁盘分区表等一系列配置信息,而物理层面镜像的是每一个相对应的物理扇区做镜像同步。在镜像同步时,是从主模块单元的磁盘同步到待机运行的从模块单元的磁盘,当服务器加电后,只有主模块单元的启动按钮灯点亮,而从模块单元灯是不点亮的。此时,按下启动按钮,服务器开始运行后系统检测无误后磁盘同步自动进行,如果想要切换主从模块,只需要将主模块单元电源断电30s之后再通电,服务器就会自动完成主从模块切换。所谓的磁盘物理镜像,也就是我们通常所说的RAID1,在容错服务器的两个模块单元中,在相同位置的磁盘做RAID1,如图2所示,每一个模块单元中都有三个磁盘插槽,从上到下编号分别为1、2、3,我们必须在相同位置的磁盘上做同步镜像,主盘与从盘一一对应,并且主盘与它所对应的从盘大小、型号必须完全相同,仅仅1M的误差就能够导致同步失败,所以容错服务器的硬盘一般都是厂家定制版。在容错服务器设计理念中,为了能够实现系统的全面整体容错功能,以及级别更高的数据安全性,在日常使用中建议对所有的磁盘都做磁盘镜像同步。当服务器完成磁盘同步后,每一个模块单元都可以看作是彼此的实时复制克隆,包括磁盘上的系统系统配置与全部数据,主从模块单元都保持完全一致。

3容错服务器的日常维护

3.1容错服务器的在线切换。容错服务器在运行时,服务器管理软件时刻监控着各个硬件的运行及健康状态,当某一个硬件出现故障不能工作时,系统通过软件自动切换到从服务器工作,而此时从服务器磁盘中的数据是和主服务器完全同步的,所以能够实现系统的不间断运行,一旦主从服务器切换,磁盘同步会立马停止(无论是否为磁盘故障),磁盘灯会变成闪黄灯。此时应该在检修时择机修复故障并恢复磁盘同步。3.2容错服务器的备份与恢复。当容错服务器的磁盘处于同步镜像后,写入数据时将同时写入镜像组中的两个磁盘,可在线拔出其中某块磁盘,而不会影响系统正常运行。当拔出的磁盘30min内重新插入到原插槽后,系统会自动进行增量同步,同步时间视磁盘单份运行时间内修改数据大小而定。利用这个属性,在修改程序之前可以将从盘拔出备份,一旦在线系统因程序修改失败出现故障,可以用备份的磁盘恢复修改前的程序继续生产,可以大大提高程序修改的可靠性,大大缩短故障时间。

通过容错服务器在热连轧技术应用中的分析可以看出,在热连轧生产技术中,采用较高可靠性的容错服务器设计理念,不仅能够满足计算机控制系统7×24h不间断运行的需要,而且还可以为用户减少故障时间,提高成材率,提高控制精度,减少后期维护工作及维护费用,为确保生产的安全稳定高效运行发挥了至关重要的作用。

作者:李照鹏 单位:唐山钢铁微尔自动化公司