数据中心智慧消防系统建设方案

时间:2021/6/4 10:35:47 关键词:数据中心智慧消防系统,数据中心智慧消防平台

近年来,数据中心消防技术发展迅速。很多企业采用新技术,并对防火规定进行了修改。一旦发生火宅,数据中心所有者或管理者可能面临特定的行业挑战,例如保护服务器设备。火灾发生时数据中心的停机可能是灾难性的,保障企业业务连续性是首要任务。此外,虽然数据中心的人员往往很少,但现场可能仍有需要保护工作人员的人身安全,因此使用智慧消防系统至关重要。

2021年当地时间3月10日凌晨,一场大火烧毁了法国斯特拉斯堡OVHCloud的钢结构SBG2数据中心,导致其托管的许多网站中某些数据永久丢失。当前,信息化的快速发展,世界各地的数据中心越来越多、越来越大,因火灾而中断服务将带来巨大损失和影响,如何系统性地加强火灾防范、减灾处置工作,成为当前必须面对的一个重大问题。

(1)火灾概况

总部位于法国鲁贝的法国独角兽公司OVHCloud(前身为OVH),在全球拥有27个数据中心,OVH是欧洲最大的托管服务提供商,也是世界第三大托管服务提供商,其位于法国斯特拉斯堡的数据中心园区,共包括SBG1、SBG2、SBG3和SBG4四栋数据中心建筑。根据该公司网站上的事件报告称,大火在当地时间凌晨1点在SBG2内的一间房内发生。到凌晨4点左右,大火完全摧毁了OVH的SBG2数据中心,并波及摧毁了SBG1八个服务器机房中的四个房间。OVH创始人和董事长奥克塔夫·克拉巴(OctaveKlaba)在推特更新中表示,SBG3中的所有服务器均完好无损,SBG4不受大火影响。但这些数据中心均由于这次事件停止服务,处于离线状态。

(2)火灾原因分析

火灾一词是由两个字构成的,因火成灾才能被称作火灾。所以我们分析火灾原因的时候,不仅要分析起火原因,还要分析致灾原因。大家都知道,火灾重在预防,但是防什么?不仅仅要防火,还要防灾!

首先是防火防灾意识淡漠,这是数据中心火灾频发的最根本原因。例如某四大行总行数据中心的总经理就曾经指责手下分管副总经理部署火灾防范工作是做无用功,他的观点非常有代表性,这位总经理说我们数据中心用的都是难燃阻燃的材料,怎么可能着火?持这种观点的人不在少数。甚至在出了这次OVH火灾后,又有媒体说,把数据中心放到海底去,就不会发生火灾了。如果真的是这样,为什么各国海军常有潜艇火灾的报道?以为海底数据仓不存在氧气就不会有火灾,但是你知道不仅只有氧气才可以助燃吗?在极高能量密度的封闭空间,有谁能保证不会起火、甚至爆炸?一旦有了这种意识,自然就不会在防火防灾上下功夫。

其次,数据中心设计上存在缺陷。数据中心的设计应确保数据中心在具备足够高的可用性水平的基础上,还要有足够的韧性,确保数据中心在局部受损的情况下还能够具备可接受的有限服务能力。数据中心的设计师缺乏防火防灾意识,就会体现到数据中心设计上。例如他们以为GB50174数据中心设计规范中对A级数据中心不存在单点故障的原则要求与火灾场景无关,防火的问题仅需要遵循防火规范的要求而不需要为数据中心进行专门的考虑。例如我在即将进入土建施工阶段的一个业主要求建成全球一流数据中心的大型A级数据中心的设计图纸上看到,双路供电的两路本该完全隔离的配电系统、UPS系统被设计进了同一个防火分区,于是只要其中一台设备起火,就会导致整个数据中心完全断电,成为单点故障。

再次,建造瑕疵。例如我已经在不止一个数据中心看到,现场与图纸防火分区不对应、消防点位不对应、防火分区与灭火钢瓶不对应,甚至发现有的气灭分区根本不存在气体管路。这些给后期运维团队有效处置火险带来了极大的不确定因素,并且通常不易发现不易验证,核对费时费力。前面那位总经理又有经典言论:实际与图纸不符是工程部门的责任,我们数据中心只需按图操作,没必要去核实。
智慧消防云平台
最后,到了运维和使用阶段,往往也因为意识淡漠,不重视消防工作,导致防不了火,防不了灾,小火成灾。比如前面提到的不去做核实工作,不能识别和控制风险;对动火作业的管理缺失,留下起火成灾的隐患;放任包装纸箱等易燃品进入关键区域并处于无人看管状态,留下了火势扩大的隐患;为了维护作业方便,不及时关闭防火门,布线作业破坏防火封堵后不及时修复等导致防火分区失效;灭火器配备不足、灭火器送检期间未补充替代灭火器,不会使用二氧化碳灭火器等,导致初起火险无法扑灭;过度依赖联动灭火,不会手动操作;组织演练时只演不练,做表面文章,人员不熟悉预案,未验证预案在夜间及节假日只有值班人员时的有效性,系统运行方式调整却不及时更新预案等,导致预案在需要的时候不能使用……

更近一步,我们还应当引导客户合理使用数据中心,引导客户采取措施,减少因数据中心服务中断给客户带来更大的损失。例如对于业务连续性要求高,难以接受业务中断的客户,我们应当引导客户采用灾备、多活等高可用方案,将其系统分布部署到有一定距离的不同地点的两个或者更多的数据中心中;对于业务连续性要求不高,尚可接受一定程度的业务中断,但业务数据价值高的客户,应引导客户进行数据备份并异地保存等。再例如数据中心场地资源分配使用时,可引导客户按照业务系统重要性和业务连续性要求的不同合理分区部署,确保当数据中心部分受损,服务能力不足时,有条件优先保障业务连续性要求高的重要业务系统的正常运行。而现实中,数据中心为了获客,往往宣传一个看似合理的虚高的可用性,使得客户对单体数据中心抱有不切实际的奢望,使数据中心火灾变成了一个牵扯众多的系统性灾难,对给客户造成的损失和声誉影响甩锅给客户:谁让你不做好灾备呢,数据丢了你赖谁!凡此种种,都可能导致小火成灾,小灾变大难。这还仅仅枚举了一部分,远非火灾原因的全部。
智慧消防云平台
(3)数据中心防范火灾的战略管理

随着国家战略的落地,数据中心在国民经济中发挥越来越重要的关键作用,而进行更加全面的有效管理,将目前以风险管控和应急预案为主的防火防灾管理,改变为着眼于为各行业,特别是对数据中心高度依赖的行业,提供连续稳定的支撑服务为目标的火灾场景下的服务连续性管理,数据中心应制定详尽的火灾场景下的服务连续性计划。做好以Reduce(减小)为目标,追求零火险、零灾难和零中断的风险管理与日常运营计划;做好满足快速灭火、减少伤亡、减少损失、业务连续、信息安全、环境影响等多方面目标要求的应急响应(Respond)和业务恢复计划,确保数据中心设施资源能够快速的恢复(Recover)到最低可接受的可用性水平,重续(Resume)数据中心服务;还要事先做好灾后重建(Restore)计划,确保数据中心有可用资源用于重建,尽快将数据中心服务水平返回(Return)到灾前水平。

数据中心智慧消防系统智慧消防云平台能够实现火警上报和处理,能够对相关的火警信息、地点、时间、频次等进行多维度的报表呈现,平台可以还原起火点的位置、电话拨打记录、联系人确认情况等信息,为火灾调查提供严谨的科学依据。同时,平台可以对网关、探测器的安装地点、状态进行查询、展示。
技术支持    金特莱智慧消防
Copyright(C) senlinzhilu &Wood 郑州金特莱电子有限公司
豫ICP备16003537号