制造企业如何消除单点故障?
发表日期:2022/01/13        作者:

电影《2012》中有这样一个情节,当人们乘坐方舟飞船逃离时,一把焊枪卡住了齿轮,从而导致舱门无法关闭,进而引擎无法发动。如此庞大的系统,居然因为一把小小的焊枪而险些毁于一旦。投入巨大人力和物力打造的救命方舟,居然做不到高可用,这显然是致命的。


这是一个生动的单点故障例子。由一个很小的问题引发的连锁反应,最终导致系统不可用。对企业IT系统而言,从基础硬件到操作系统,再到数据库和应用程序,每一个环节都有可能发生单点故障。如果要有效地消除单点故障,最重要的一点是,在系统设计时尽量避免引入单点问题,同时随着IT架构的变化,定期审查系统潜在的单点也是必要的。



传统模式下,企业消除单点故障的方式主要通过双机热备。其思想是主机和从机通过TCP/IP网络连接,正常情况下主机处于工作状态,从机处于监视状态,一旦从机发现主机异常,从机将会在很短的时间之内代替主机,完全实现主机的功能。


这种构造思路很好,相当于无时无刻都有一个“替身”,但这种模式却存在一个很大的弊端,即两台服务器共享一台存储设备,假如这台存储设备出现故障,那业务就停顿了,数据也会丢失。抛开这种风险不说,双机热备的部署也比较复杂,且一个应用部署两台服务器,其投入成本也非常高。



那么,有没有一种既安全可靠又成本低廉的方法来排除单点故障?



最近,三诘股份有限公司为保证生产系统的安全可靠运行,通过与Stratus合作,将公司内部的数据库、ERP、设计工具平台以及文件系统部署到Stratus ftServer 4810容错服务器,在一台服务器支撑起企业的生产运营,并实现了故障无缝切换,其高可用性达到了99.999%以上。



三诘股份有限公司是一家板金专业加工厂,创立于1977年,专注于精密机械板金、定制化医疗辅具以及电子半导体领域。近年来,为解决生产系统中的单点故障隐患,三诘公司对市面上多种软硬体高可用性方案进行了深入评估,做了详细测试对比,最终选择了Stratus ftServer容错服务器。


与传统服务器相比,Stratus ftServer容错服务器的性价比更高、维护更简单,且成本更低。此次,三诘公司部署的是Stratus ftServer 4810系列容错服务器,并安装了Windows Server 2012系统,将SQL Server 2012、ERP、设计工具平台和File Server迁移到上面。最后,ftServer容错服务器都被部署在三诘公司位于嘉义的公司机房,为关键生产系统提供持续高可用保障。


相对双机热备,Stratus ftServer 4810容错服务器在内部采用冗余硬体架构,部署两组完全一样的硬件模组,通过先进的容错芯片实现CPU、内存、硬盘和网卡等的资料指令同步,可实现硬体模组故障无缝切换,使系统完全不存在硬体单点故障风险,高可用性达到最高级别99.999%。



据工厂信息化负责人介绍,自2019年ftServer系统上线后,三诘公司的生产系统停机时间为零,在高可用系统的支撑下,企业员工可以高效的执行工作,促使生产力得到大幅提升。ftServer系统能够以较低的总成本,为关键的产线系统提供高可用性的最佳解决方案。自从在ftServer系统上部署了IT基础环境及应用程式,三诘公司的IT基础环境系统实现零停机,既满足了公司经营者和维运人员的系统可靠性要求,又为使用者提供了一个快速安全可靠的生产作业环境。



笔者认为,品质和效率是企业的生存的根本,成本是企业提升竞争力的关键。随着数字化技术应用的成熟以及客户对高品质产品的无止境追求,能否在确保价格优势基础上,在同等水平中提供快速的交货期及高精度的品质,将成为企业不断赢得客户以及拓展市场的关键。这一过程中打造一个安全可靠、高效快捷的系统至关重要。

新工业首页