数据中心体系逐步建立起来,但风险也随之膨胀。
经过多年的信息技术系统建设和业务流程重组,中国各重要行业、重点企业都已经完成集中化的数据中心体系建设,大型的政府数据中心、行业数据中心和企业数据中心已经建立起来。然而,与此同时,IT风险也急剧膨胀起来。
数据中心逐步集聚的IT风险,已成为我国信息化建设中最大的安全问题。从根本来看,建立高可用性的数据中心基础设施和专业化的运行管理体系,并建立完善的灾难备份、业务持续和应急预案体系,是确保信息系统安全运行的根本措施。
但是,建设一个高安全性数据中心的投资是巨大的,周期是较长的,而管理和运营就更加不容易了。怎么办?从国外的发展经验来看,利用专业的数据中心服务商提供的服务是一个又好、又快、又省的选择。
针对数据中心建设标准定义了四个级别:
T1数据中心:基本型
T1数据中心可以接受数据业务的计划性和非计划性中断。要求提供计算机配电和冷却系统,但不一定要求高架地板、UPS或者发电机组。如果没有UPS或发电机系统,那么这将是一个单回路系统并将产生多处单点故障。在年度检修和维护时,这类系统将完全宕机,遇紧急状态时宕机的频率会更高,同时操作故障或设备自身故障也会导致系统中断。
T2数据中心:组件冗余
T2数据中心的设备具有组件冗余功能,以减少计划性和非计划性的系统中断。这类数据中心要求提供高架地板,UPS和发电机组,同时设备容量设计应满足N+1备用要求,单路由配送。当重要的电力设备或其他组件需要维护时,可以通过设备切换来实现系统不中断或短时中断。
T3数据中心:在线维护(全冗余系统)
T3级别的数据中心允许支撑系统设备任何计划性的动作而不会导致机房设备的任何服务中断。计划性的动作包括规划好的定期的维护、保养、元器件更换、设备扩容或减容、系统或设备测试等等。大型数据中心会安装冷冻水系统,要求双路或环路供水。当其他路由执行维护或测试动作时,必须保证工作路由具有足够的容量和能力支撑系统的正常运行。非计划性动作诸如操作错误,设备自身故障等导致数据中心中断是可以接受的。当业主有商业需求或有充足的预算追加,T3机房应可以方便升级为T4机房。
T4数据中心:容错系统
T4级别的数据中心要求支撑系统有足够的容量和能力规避任何计划性动作导致的重要负荷停机风险。同时容错功能要求支撑系统有能力避免至少1次非计划性的故障或事件导致的重要负荷停机风险,这要求至少两个实时有效地配送路由,N+N是典型的系统架构。对于电气系统,两个独立的(N+1)UPS是一定要设置的。但根据消防电气规范的规定,火灾时允许消防电力系统强切。T4机房要求所有的机房设备双路容错供电。同时应注意T4机房支撑设备必须与机房IT设备的特性相匹配。
建筑定级
建筑T1级别
对于可能引起数据中心瘫痪的人为地或自然灾害不做任何建筑防护措施;设备区地面活荷载不小于7.2kPa,同时楼面另需满足1.2kPa的吊挂活荷载。
建筑T2级别
T2机房应满足所有T1机房的要求外应有建筑防护用于避免由于自然灾害或人为破坏造成的机房瘫痪;机房区域的隔墙吊顶应能阻止湿气侵入并破坏机械设备的使用;所有安防门应为金属框实心木门,安防设备间和安保室的门应提供180度全视角观察孔;所有的安防门必须为全高门(由地面到吊顶);安保设备间及安保室的隔墙必须为硬质隔墙并加装厚度不小于16mm三合板,至少每隔300mm要用螺丝固定;设备区地面活荷载不小于8.4kPa,同时楼面另需满足1.2kPa的吊挂活荷载。
建筑T3级别
除满足T2要求外还应满足如下要求:需提供备用的出入口和安全监察点;提供备用安全出入道路;机房外墙上不能有外窗;建筑系统应提供电磁屏蔽保护;钢结构应提供电磁屏蔽保护;屏蔽层可以是贴铝箔的板材或金属网;机房入口应设置防跟入系统;对于冗余的设备应提供物理隔断以降低同时宕机的可能性;应设置防护栅栏以控制非正常侵入事件,同时建筑外围应设置微波探测和视频监控系统;厂区应设置门禁控制系统;机房区,动力区应设置门禁系统,并提供门禁控制中心监控系统;设备区地面活荷载不小于12kPa,同时楼面另需满足2.4kPa的吊挂活荷载。
建筑T4级别
除满足T3要求外还应满足如下要求:考虑对于同一灾害的冗余保护措施;考虑潜在的地震、洪水、火灾、暴风、暴风雨以及恐怖主义者和精神病人防护措施;柴油发电机应位于室外或其他建筑内;在室外规划油罐区且尽量靠近柴油机;位于地震带0,1和2上的数据中心建筑按地震带3的要求设计抗震,位于地震带3和4上的数据中心抗震按地震带4的要求设计抗震,所有的设备设计重要系数取1.5;位于地震带3和4上的数据中心设备和机架应设计顶安装的抗震支架;设备区地面活荷载不小于12kPa,同时楼面另需满足2.4kPa的吊挂活荷载。
电气定级
电气T1级别
T1级别的机房只需要提供最低的电气配电以满足IT设备负荷要求;供电容量少量或无冗余要求;单路供电;供电回路无检修冗余要求;单套等容量柴油发电机系统可以安装用于容量备用,但不需要冗余;ATS开关用于柴油发电机系统和变压器系统的电力切换;ATS并不是强制要求的;需要提供模拟负载;需要提供单套等容量UPS系统;UPS系统应与柴油机系统兼容;UPS应带有维修旁路以确保UPS检修时正常供电;应急电源可以来至不同的变压器和配电盘;变压器应能满足非线性负载使用要求;要求提供PDU和现场隔离变压器;配电系统不需要冗余;提供接地系统;数据中心接地干网不需要,但应满足设备制造商的接地要求;防雷保护应满足NFPA780相关规定;
电气T2级别
T2级别数据中心除满足T1要求外,还应满足如下要求:T2机房应提供N+1的UPS系统。提供发电机系统,其容量应满足所有数据中心负荷要求,备用发电机是不需要的。动力设备和配电设备不需要冗余设计。发电机和UPS系统测试时应提供模拟负载连接。重要的机房设备配电应提供集中地PDU配电。PDU出线应配置分支回路。两个冗余的PDU应由不同的UPS系统供电,并为同一IT配线架供电。单相或三相IT机架供电来源于两个不同的PDU,且双路电源可实现静态无间隙转换。双进线静态转换PDU供电来自不同的UPS系统,并可为单相或三相设备供电。颜色标示标准被用来区分A,B两路供电电缆。每个回路只能为一个配线架供电,防止单回路故障影响过多的配线架。为实现配电冗余,每个机架或机柜配电回路开关容量为20A,来源于不同的PDU或配电盘。满足NEMA L5-20R标准的工业自锁插座被要求应用于机架配电系统,同时配电开关容量应根据设备容量调整放大,并标明配电回路来源。机械设备配电不需要冗余设计。要求提供接地系统,接地电阻小于5欧姆。要求消防电力系统强切。
电气T3级别
T3级别数据中心除满足T2要求外,还应满足如下要求:T3数据中心要求所有的机房设备配电、机械设备配电、配电路由、发电机、UPS等等提供N+1冗余,同时空调末端双电源配电,电缆和配电柜的维护或单点故障不影响设备运行。中高压系统至少双路供电,配置ATS,干式变压器,变压器在自然风冷状态下满足N+1或2N冗余,在线柴油机系统用于电力中断时电源供应。储油罐就近安装于厂区,并满足柴油机满载72小时运行。市电失电时通过ATS自动将油机系统电力接入主系统。
双供油泵系统可以手动和自动控制,配电来自不同电源。提供独立的冗余的日用油罐和供油管路系统,以确保故障或油路污染时仍能正常的为油机供油,不影响油机运行。油机应装备双启动器和双电池系统。ASTS用于PDU实现双路拓扑的配电体系用于重要IT负荷配电。设置中央电力监控系统用于监控所有主要的电力系统设备如主配电柜、主开关、发电机、UPS、ASTS、PDU、MCC、浪涌保护、机械系统等。另外需提供一套独立的可编程逻辑控制系统(PLC)用于机械系统的监控和运行管理,以提高系统的运行效率,同时一套冗余的服务器系统用来保证控制系统的稳定运行。
电气T4级别
T4级别数据中心除满足T3数据中心要求外,还应满足如下要求:T4机房所有设备、系统、模块、路由等需设计成2(N+1)模式;所有进线和设备具有手动旁路以便于设备维护和故障时检修;在重要负荷不断电的情况下实现故障电源与待机电源的自动切换;电池监控系统可以实时监视电池的内阻、温度、故障等状态,以确保电池时刻处于良好的工作状态;机房设备维修通道必须与其他非重要设备维修通道隔离;建筑至少有两路电力或其他动力进线路由并相互备用。
机械定级
机械T1级别
空调系统设置单台或多台空调设备集中制冷用来维持重要区域的温湿度,设备不需要冗余;如果空调系统采用水冷设备如冷冻水系统或冷却水系统,那么在满足设计条件的前提下,尽量采用相同规格的设备,设备不需要冗余;管路系统采用单回路系统,因此管路故障或维修时,将导致局部或全部的空调系统停机;如果有发电机系统,那么空调设备容量将被记入发电机容量内。
机械T2级别
T2级别的数据中心空调系统是采用多台空调设备集中制冷来维持重要区域的温湿度控制要求;一般采用N+1的备用方式;如果采用水冷系统,相关设备需要采用相同规格,并提供额外1台设备用于备用;管路系统采用单回路系统,因此管路故障或维修时,将导致局部或全部的空调系统停机;机房空调系统应设计成全年365天,每周7天,每天24小时连续运行模式;机房空调至少采用N+1备用模式,同时每三台或四台设备要求至少提供一台备用;机房及其辅助区域相对于室外要求维持一定的正压;所有的空调设备配电容量应被记入发电机容量;为降低电气系统故障对空调系统的影响,空调设备供电尽量来源于多组配电盘的多条回路;温度控制系统配电应来源于UPS且提供冗余的备用电源;数据中心的送风形式应根据机架和服务器的排布来调整;空调机房设备应有充足的容量来抵消所有发热设备和热传导负荷,同时维持一定的机房湿度要求;设备的制冷量应基于KW而不是KVA计算,且设备由UPS供电;被处理的空气将通过安装了平衡风阀的穿孔高架地板送到设备处;发电机系统用来给UPS系统和其他机械设备提供电力;厂区内需安装储油罐系统,以满足额定工况下24小时发电机运行;需设计双路供油系统,且可以提供手自动控制,每路供油泵供电来源于独立的配电系统;设计冗余的和相互隔离的储油系统以保证油路污染或其他机械故障时不影响整个发电机系统的运行。
机械T3级别
T3级别的数据中心空调系统是采用多台空调设备集中制冷来维持重要区域的温湿度控制要求;设备冗余的方式是允许单台配电盘故障时空调系统仍能满足制冷需求;如果空调系统采用水冷设备如冷冻水系统或冷却水系统,那么在满足设计条件的前提下,尽量采用相同规格的设备,设备冗余的方式是允许单台配电盘故障时空调系统仍能满足制冷需求;这个级别的冗余要求要求空调及其相关设备末端双回路供电;管路系统采用双回路路由,任何管路维护或故障时不会引起空调系统的中断;机房空调电源采用双回路供电,电源来自不同的配电系统;所有的机房空调容量需要记入发电机容量;数据中心制冷设备N+1,N+2,2N或2(N+1)的冗余方式都是可行的,前提是设备维护和故障时不影响正常的制冷要求;针对精密空调的安装数量,考虑到维护和备用的因数,精密空调冷却回路应尽量细化分组;如果使用了冷冻水或冷却水,每个数据中心应有专用的分支回路,并由独立的泵系统从主供水环路上引出;水环路应位于数据中心周边下夹层水槽中,以确保漏水被收集在水槽中,漏液侦测传感器安装于水槽中,检测管路漏水状态;应考虑冷冻水管路的冗余和充分隔离。
机械T4级别
T4级别的数据中心空调系统是采用多台空调设备集中制冷来维持重要区域的温湿度控制要求;设备冗余的方式是允许单台配电盘故障时空调系统仍能满足制冷需求;如果空调系统采用水冷设备如冷冻水系统或冷却水系统,那么在满足设计条件的前提下,尽量采用相同规格的设备,设备冗余的方式是允许单台配电盘故障时空调系统仍能满足制冷需求;这个级别的冗余要求要求空调及其相关设备末端双回路供电;管路系统采用双回路路由,任何管路维护或故障时不会引起空调系统的中断;机房空调电源采用双回路供电,电源来自不同的配电系统;条件允许的情况下,储水池是可以使用的。