数据中心应急备份技术解析
数据中心是各种数据集中处理的场所,运行起来各种系统异常复杂。从数据中心开始运行直到生命周期结束,任何一个数据中心也无法做到不出问题,就算是谷歌、阿里等互联网巨头公司的技术先进的数据中心也会出现这样那样的问题。正因为这样,涌现出了很多的备份技术,对数据中心运行的各个环节进行备份,一旦主设备运行出现了问题,可以有备份设备接管继续运行,确保数据中心业务不受严重影响。在中大型数据中心里,都部署了很多的备份设备和技术,对关键系统进行备份,以防因为部分设备故障导致数据中心业务瘫痪。所以对于数据中心,备份技术不可缺少。本文主要讲的是应急备份技术,既然是应急自然是对突然发生的需要紧急处理的事件,应急备份技术指的是应对突发故障的备份技术。数据中心应急备份技术有很多,本文主要讲的是数据中心里最为重要的几种技术。
应急电源技术
数据中心的正常运转离不开电,持续稳定的供电对于数据中心尤为重要。但是在很多时候,由于各种原因数据中心还是可能发生断电现象,比如:市电供电线路故障、数据中心内部部分设备或线路短路等,造成数据中心部分设备或整体发生断电。正是这样,所以在数据中心里从供电输入到设备输入都有多级的备份装置,就是防止设备出现断电。我们知道数据中心的电绝大多数来自于市电电网,能否自己有发电站,自己供电的数据中心很少,在国内还没有看到有,除了市电,一般还有另外一路应急电源输入。当市电出现故障时,自动切换到应急电源。当我们走进数据中心园区时,在机房建筑物的外面有时会看到几座很大的供电箱体,上面写着应急电源,这个平时并不工作,一直在蓄电,一旦市电故障蓄电池就会启动工作。这个应急电源会根据数据中心的容量,一般可以工作十几个小时,作为数据中心临时供电输入。很多数据中心都用蓄电池方式作为应急电源,这使得蓄电池方式的应急电源特别多,比如:铅酸蓄电池、飞轮储能蓄电池、超级电容器、燃料电池、锂离子电池等,这些蓄电池工作原理上有所差异,各有优缺点,基本原理都是平时存储电能,在数据中心断电时临时启动工作。还有的数据中心自己准备有一组柴油发电机组,需要其工作时柴油发电机组开始工作,这个工作起来噪声大、废气多,对周围环境有很大影响,不过比蓄电池要工作时间长些。在一些运营商企业自己还准备了一些移动应急电源,在数据中心出现断电时,这些载有蓄电池的汽车会直接开到数据中心完成供电,这种方式非常灵活、方便。
应急冷源技术
数据中心内部要保持恒温恒湿,空调系统必须全年24小时运转,一旦出现故障,时间一长数据中心内部的温度就会上来,很多服务器设备在温度超过40度时都会自动重启来保护设备器件,防止温度过高对设备造成损害。在这种情况下,数据中心就无法正常运转,所以数据中心还需要准备应急冷源。蓄冷装置可在供冷中断时当作应急冷源使用,对于大型数据中心蓄冰装置更合适,动态制冰、外融冰盘管、冰球等都可以作为数据中心的应急冷源,应急冷源在实际使用中,往往可能会待机几个月不投入使用,其内储存的冰在长期待机过程中会因散热而满满融化,导致冷量损失,所以要持续进行制冰处理,保持蓄冰装置内任何时候都有足量的冰。应急冷源对于数据中心来说利用率不高,但是却要耗费大量的人力、物力来维护,所以实际数据中心采用的很少,一般都通过空调系统的备份、冗余来做到冷源备份,这种方式比起直接建造一个蓄冰空间并维护要省钱得多。
应急照明技术
应急照明是消防安全的要求,不仅是数据中心,任何建筑都需要有应急照明。数据中心在这方面没有什么差异,一般讲应急照明灯安装在机房内墙壁上,部署在机柜两侧的墙壁上。在正常照明电源发生故障时,能有效地照明和显示疏散通道,或能持续照明而不间断工作的一类灯具。这些应急照明平时并不工作,当数据中心照明系统断电或者市电断电时,自行启动工作,确保在危机的情况下,数据中心内部人员可以得到安全疏散,应急照明主要还是从建筑安全的角度考虑的。
应急设备技术
数据中心里的设备很多,几乎每天都会有这样那样的故障,很多时候设备发生了硬件故障或者是未知的软件故障,就需要对设备进行更换,确保不对数据中心整体业务影响,所以一般数据中心都会建一个小型的备件库,对于重要核心的设备部件备用几套,以防设备出现故障时,可以有备件更换。数据中心的备件库用来储存备用设备和器件,对环境的要求和数据中心机房相同,要保持恒温恒湿,灰尘浓度要低,防止备件在长时间放置过程中元器件发生氧化。很多时候,有的数据中心备件一放就是几年,当真需要用的时候拿出来发现已经不能用了,这就起不到备份的效果,所以数据中心还要周期性地对备件库里的备件设备进行检查,并上下电检测一下设备运行是否完好,避免出现损坏的情况。很多设备在长时间不使用的情况下,也会出现器件老化而故障的现象,需要通过检查来避免。
本文介绍了几种数据中心应急备份的技术,可以看到这些备份技术都是硬件备份技术,其实数据中心更多的是软件层面的备份,有很多的软件备份、冗余技术,在此不再详说。这些应急备份是数据中心安全运行必可缺少的重要组成部分,既然是备份就是很多时候并不在工作,这样数据中心就要考虑运行效率,如果数据中心整体运行安全系数比较高的话,就可以适当减少应急备份的投入,不怕一万就是万一,不管怎样应急备份对于数据中心,不可缺少。