电站计算机系统软件平台的优化及改进

时间:2022-02-26 08:45:04

电站计算机系统软件平台的优化及改进

秦二厂1/2号机组是我国自主设计、自主建造、自主管理和自主运营的首座2×65万千瓦商用压水堆核电站,分别于2002年4月和2004年5月投入商业运行。电站计算机系统是核电厂的大脑中枢,操作员的眼睛,其性能与核电厂安全、稳定运行紧密相关,目前秦二厂1/2号机组使用的是由北京和利时系统工程股份有限公司于1999年开发的HS2000CAS系统。

1系统简介

电厂过程计算机系统由集中数据处理(KIT)和安全显示盘(KPS)两部分组成,简称为KIT/KPS系统——集中数据处理及安全显示盘系统,为操纵员提供数据采集信息与状态、协助运行、电站运行数据或事故数据处理、反应堆监督、安全显示盘等功能。KIT/KPS系统由工程师站、操作员站、现场控制站、打印控制站、通信控制站、系统服务器、管理网络、系统网络和控制网络等组成,包括工程师站专用组态软件,操作员站、现场控制站、打印控制站、通信控制站。

2软件平台的应用与改进

秦二厂1/2号机组电站计算机系统在运行期间,在软件平台上的故障率远高于硬件的故障率,因此维护人员与厂家技术人员通过长期的分析和测试,成功解决了以下软件平台的问题。

2.1历史库任务模块的升级

故障现象:在KIT系统中可以显示工艺系统各点的历史及实时趋势,并将其作为文件的方式保存下来,在长期运行过程中维护人员发现在跟踪或历史方式下,综合趋势曲线最新数据下掉到“0”(无效)。分析与评估:历史库初始化时,开辟了两块内存空间,每块内存空间能保存10分钟的历史数据。历史库任务中的数据收集线程在定时器的触发下,按数据库点定义的收集周期,读取实时数据库中的实时值,根据收集时间计算出收集位置后,将该实时值写入对应的位置,一个内存空间例如0号空间数据收集满后,该块内存数据被存储到磁盘文件,同时将另一块内存中即1号空间数据全部初始化为0,将数据收集到1#空间,如此循环。如服务器负荷偶然增加或Windows高精度定时器调度的原因,引起某拍定时器触发时间不当,计算出该拍数据对应的内存位置超前或滞后,例如本应该收集在i的位置,但收集在了i+1或i-1的位置,则位置i被空出,其值为0,在操作员站显示该数据的时候,就出现了历史方式下曲线下掉为0。解决方案:升级服务器历史库任务NewHDBServer.exe增加“向前补拍”补丁,即,如果计算出的收集位置为i,则将i+1以及i+2的位置也写入位置i的值,这样,可以防止偶然的错过收集位置,还可以进一步防止跟踪方式下曲线下掉。

2.2主备服务器系统信息数据不一致

KIT系统的服务器就采用冗余热备的配置,在系统运行中发现,两台服务器的部分数据不一致,包括日志信息不一致、报警信息不一致、表格信息不一致、操作人员自定义变量组、趋势组不一致。分析与评估:系统软件设计:当有一台服务器在运行,另外一个服务器在冷启动、热启动的启动方式下,后启动服务器未将将日志、表格和自定义变量组、趋势组与主服务器对齐,启动时未对齐为不一致发生的最主要原因。运行过程中根据现场控制站和操作员站发生的事件和操作,产生各自的事件以及相应的修改。因此,系统服务器重新启动必然引起双服务器上的数据不一致,运行过程也可能产生不一致。解决方案:消除此不一致的方法如下:对以上所列数据,有针对性地增加“启动对齐”和“周期对齐”处理过程。在启动时,后启动服务器主动向主服务器请求相关数据,做初始对齐。通过此修改可从很大程度上解决不一致问题。运行过程中,从服务器周期向主服务器请求相关数据,做周期对齐,对齐时间要求大于半小时。改进后实现了双服务器各项信息的一致性,保证了系统运行的可靠性与准确性。

2.3服务器启动和切换扰动日志的过滤

KIT系统服务器在进行切换或热启动时,设备故障日志中出现很多设备故障和故障恢复信息,影响到部分重要设备动作信息的监视。分析和评估:服务器停运时,服务器节点,作为系统的主要节点和系统的主要数据发出方和接收方。从ArcNet环形网络中断开,导致网络的重构,有些现场控制站节点需要几次才能重构成功,如果某一个现场控制站重构时间过长,在新的网络节点表建好之前,现场站发往服务器节点的数据还会被尝试发送。或者直接导致芯片的中断丢失,这都会导致数据缓冲区中的数据不断增大,致使某一现场控制站的数据包不能及时发到服务器上,更差的情况是当通讯程序判断到数据缓冲区的数据量满了之后,会重新启动ArcNet程序。当现场站单网出现上述情况时,主服务器会监测到网线故障,当现场站的双网都出现上述情况,会出现站故障和网线故障信息。解决方案:升级服务器结点诊断任务,将设备故障周期适当加长,滤掉启动的扰动。加长诊断周期后,能过滤掉部分故障/故障恢复事件,在故障期间现场控制站本身工作正常,不会重新启动;设备故障事件延迟;以上扰动只发生在服务器停止运行时。该程序滤掉了由于服务器扰动而产生的日志信息,同时不会滤掉真正设备故障的信息,确保了日志信息的可靠性。

3结语

依靠系统工程师有效的改进和不断地发现,及时纠正软件平台的错误,保证系统的安全稳定,使得KIT/KPS系统的功能更加完善,稳定,可靠性不断提高。KIT/KPS系统自安装调试至今,已稳定可靠运行10年多时间,作为核电站监控层的中心,保证系统稳定、高效运行、减少停堆时间、提高管理水平等诸多方面发挥着巨大作用,为今后实现国产核电站数字化仪控系统打下了坚实的基础。

参考文献

[1]颜昌辉.秦山二期KIT/KPS系统与一体化信息管理与自动控制讨论[Z].中国核科技报告,2000.

[2]核工业第二研究设计院.KIT/KPS系统手册[Z].2015.

作者:关悦 周焕 张进松 张瑞华 单位:中核核电运行管理有限公司