DCS系统画面数据通讯中断故障原因分析
DCS系统画面数据通讯中断故障原因分析
一、设备概况及简介
装置采用FOXBORODCS控制系统,2011年投入使用。
二、故障经过
2013年,柴油加氢控制器PF1/PF2大部分数据出现蓝色底色,数据变为星号,显示为通讯故障。
三、原因分析
(一)过程检查及分析
1.期间重新启动过FCR02的交换机、交换机/CP的 host 工程师站、更换 过CP、CP 的通讯模块 split,但情况依旧。
2.将此控制器更换交换机的通讯口,情况依旧,因此判断网络上是否存在 对此控制器的大量数据通讯量。
3.通过交换机监控软件查看得知 PF1/PF2 交换机端口的通讯量为正常情况下的 6~8 倍。然后重新启动过部分操作员站,失效数据的量略有所 减少。
(二)故障根本原因
1.直接原因:过多的overlay打开,某些overlay虽然关闭,但是工作站和CP的通讯链接没有正常释放,尚在CP内存在,日积月累后造成无用链接量的不断的累计,最终使得CP内通讯负荷增加,造成CP的通讯堵塞,新增连接无法正常获取数据。
2.间接原因:由于是重启历史站造成,但是实际上那台历史站只有不到20个CRCS单元的历史数据点,更多的是作为OPC的数据源使用,因此判断是由于OPC的负荷过多有关系,然后重新在OPCServer中查看了所有点,删除了一些坏点(即在OPCServer的alias中有,但是在实际的CP内没有的点,因为当坏点存在时,OPCServer会不断在CP内去获取坏点的数据,但是由于CP内没有此点,最终会造成死循环,增加网络的负荷)
3.管理原因:控制系统组态没有及时清理多余的数据请求节点。
四、整改措施
1.定期重启工作站。在工作站重启时,会在网络上进行广播,告知CP释放此工作站对于CP的链接资源,通过此种方法可以减少由于工作站造成的占用过多CP链接资源。
2.ICC组态中删除点的同时删除OPCServer中alias的组态,减少坏点的存在。考虑OPCClient中无用点,减少OPCServer的获取量。
3.期查看交换机监控软件,查看哪些CP网络端口的数据通讯负荷量过大或者大于正常的通讯量,重启网络上直接获取哪些CP数据的工作站来查看端口的负荷是否变化。
五、总结与启示
装置在运行后期应检查数据访问源,及时清理无用数据访问源。