四川成都机房建设,机房,信息中心,云计算中心,数据中心!
成都机房建设工程:工厂,学校,医院机房
云计算机心,数据中心,弱电工程,信息化,指挥中心建设
机房建设
机房动态 | News Center
您的位置:成都机房建设 > 机房动态 > 公司新闻 > 现代数据中心供电系统存在的六大问题

现代数据中心供电系统存在的六大问题

数据中心中,供电系统是基础设施最重要子系统之一,而长期以来,业界对供电系统的认识一直停留在电力电子技术层面,很少有权威的专业机构认真地研究用户在使用过程中存在的系统规划设计和方案配置的问题。传统供电系统中存在的问题更多的表现在系统规划设计、供电方案的选择、设备的正确使用等系统工程方面。

特别是很多错误的观念和设备厂商的误导,使这些问题更加严重和难以解决。归纳起来有以下六个方面的问题:

过度规划和生命周期成本问题;

供电系统的适应性及可扩展性;

供电系统可用性的问题;

设备的安装与使用问题;

UPS对供电系统的可管理性问题;

可修复和维护问题;

对以上问题现象做了详细的描述:

一、过度规划和生命周期成本问题

1、过度规划和设备利用率低下。采用“一次到位”的方式,最初装机运行时,设备的实际负载量仅为9%左右,第5年时预计负载量增加到设计容量的80%左右,而供电设备的实际负载量只达到设计容量的30%左右。

2、空间或占地面积的问题。电力设施包括发电机组、UPS系统、电池系统、输入开关柜和输出配电柜等。随着IT设备的小型化,人们发现IT设备所占空间与基础设备所占空间的比例有越来越小的趋势,这使得用户的心里感到不平衡。能否压缩整个整个供电系统所占用的空间呢?

3、装配速度问题。设备采购存在着交货周期的题,方案设计和系统安装都需要时间。用户必须提前6个月购买这些系统和设备,通常情况下,数据中心的实际建设时间一般要3~18个月不等。用户希望能够缩短从做出决定进行修建到实际建成并投入运行的时间。

4、能源效率问题。对于传统的未刻意做节能设计的数据中心,整个供电系统的能耗占数据中心总能耗的21%,在能耗指标PUE(假定等于2.8)中占的比例是0.45左右,所以供电系统的效率在75%左右。

5、服务合同的费用问题。由于大型UPS系统的复杂性,加上缺乏技术娴熟、经验丰富并经过高级培训的技术人员,导致了服务合同费用的居高不下,更令用户感到不平的是,服务费用都是按照UPS的装机容量来报价的,尽管用户实际只用到了UPS 70%以下甚至只有10%的容量。用户希望能够找到降低复杂性的途径,以此来简化所服务并降低服务合同的费用。

二、供电系统的适应性及可扩展性

1、系统和部件的标准化与规范化。目前大型UPS系统变得越来越复杂,导致现场工程设计工作和设计方案的多样性,增加了用户或技术顾问公司、设计院的负担,顾问工程师会因设计的复杂性和资源配置问题而承担极大的风险。用户希望有一种方案能够使得所有部件标准化、规范化,这不仅可降低设计和施工的工作量,还可以降低设计和组建的风险。

2、不可预测的功率密度问题。用电设备的功率密度不断增大和配置不均衡为设备的配电提出了挑战。一个机柜如果安装早期的服务器,只能容纳10台(10个电源插座),现在,一个机柜能容纳40个1U的服务器(40个电源插座),将来这个数目还可能增加。用户提出这样的疑虑:电力基础设施能否适应这种不断变化而又无法预测的功率密度带来的影响呢?

3、如何适应不断变化的其他需求。机柜内的设备升级更换时会导致许多其他问题,诸如新旧设备的重量密度不同、安装要求不同、单电源设备与双电源设备对配电要求不同、交流设备与直流设备对配电要求也不同等。除此之外,UPS容量的扩展也面临以下3个问题:新旧UPS系统的兼容问题;新扩容的UPS与现场环境的匹配问题;扩容升级过程中会不会被迫中断现有业务。用户非常希望有一种不停电扩容的解决方案。

三、供电系统可用性的问题

1、断路器数量增加以及指标离散性问题。供电系统和关键负载之间配置了许多断路器,每个断路器都是一个单路径故障点。另外,相同指标而不同厂商的断路器,其运行过程中的实际动作稳定值也存在着很大差异,这在很大程度上影响了供电系统线路保护机制。情况最糟糕时,下游断路器可能不会动作,而最终导致上游的断路器动作,结果发生大面积负载掉电的情况。用户希望能够减少断路器的数目以及使用更加标准化的断路器。

2、操作人员人为操作失误的问题。造成关键负载宕机的大部分原因是由于供电系统复杂性极高而又缺乏处理这类复杂系统的专业技术人员等原因造成的。除此之外,针对如此复杂的系统,对人员进行的培训也远远没有达到所需要的水平。用户非常希望得到一种能够很容易地减少人为因素的解决方案。

3、把供电与负载之间的故障点减至最少。过去,用户通常在交流输入和UPS环节引入冗余设备,但是他们往往忽略终端配电一级的单路径故障点,例如他们在UPS和关键负载之间设置多个断路器,而且UPS和关键负载之间的距离很长,有的UPS放置于地下室而负载放置于5楼的情况,所以希望冗余设施距离负载能够更近一些,并且减少UPS和关键负载之间的断路器数量。

4、减少大面积断电的故障点。一旦宕机发生,我们希望故障的影响尽量局限在小面积的用电设备。用户在设计整个供电系统时往往会在集中式供电或分布式供电这两种方案中犹豫不决:集中式供电有许多优点,但是它的致命缺陷是一旦供电系统发生故障,所有设备均会因停电而宕机;分布式供电能够解决大面积业务中断的危险,但是存在着不易管理等缺点,用户希望能够消除并控制自己电源系统的故障。

5、供电系统的谐波干扰问题。高次谐波不仅会降低设备输入功率因数,直接污染电网,无功电流的存在还会增加电网容量和系统配置容量,增大能源损耗和运行成本,而附加的滤波器,不仅重量、体积和成本都显著增大,而且还存在着电路发生振荡的可能。用户希望能够减少供电设备产生的谐波干扰。

6、用户与厂商之间信息共享问题。由于设备安装的复杂性,故障发生时对故障根源的分析变得非常困难。用户指出,基础设施部件中存在着太多的变化,希望能够通过统一标准的系统收集数据和比较结果,并且规范校正和处理的措施。他们希望同一机构内不同场地的机房能够使用同样设备,从而管理人员能够相互分享管理经验及故障处理经验。

四、设备选用和安装使用问题

1、采购设备时存在着错误的观念和误导。例如确定选用UPS的性能标准时,不是从UPS的输出电性能指标、输出能力和可靠性指标、对电网的适应能力、系统配置能力、智能管理和通讯功能、可维护性和可扩充性等方面对其进行全面的考察,而是受厂家的误导,把厂家宣传的产品能达到的某些最高性能指标做为自己选用的标准;简单地以UPS电路结构形式定优劣。

2、系统设计缺欠造成潜在的质量问题。很多已经在运行的供电系统在设计上不规范,系统配置不尽合理,存在着诸多隐患。诸如:所有设备都是串连的,形成单路径故障点;各相接的设备输入输出阻抗不匹配;因配置了输入谐波电流大和启动冲击电流大的设备,不仅污染电网,而首先是在系统内部形成严重的相互干扰;电力传输线过长和布局零乱而易产生干扰和发生人为事故;配置了大量的断路器,由于产品质量问题,或者在容量和动作时间方面配置得不合理,使系统有时发生不明的故障;系统零、地线系统设计和线缆选用不符合标准等。

3、缺乏可量化的可靠性衡量指标。安全性和可靠性是当前供电系统最主要的问题。但是在选用设备时,却没有可量化的可靠性指标作为选用的依据。UPS设备厂家提供的可靠性指标是平均无故障时间MTBF,是一个概率指标,在采购设备时这项指标是不可测量验证的,因而最终是不可信的。一种常见的现象是,用户刻意选用的高可靠的设备,而实际运行后却故障频繁。用户希望有一种可信的可量化的可靠性指标。

五、UPS对供电系统的可管理性问题

1、UPS输出的分路管理问题。用户对分支电路的超载问题比较关心,分支线路过载时,断路器就会动作,该支路内连接的机柜的所有设备就会宕机。在极端情况下,会发生保护该过载电路的断路器不动作而引起上游断路器动作,这将使更多的机柜或更大面积的设备发生宕机。用户非常希望能够获得可管理的输出,以便在上述故障发生之前可以得到报警。有些用户甚至提出希望在机架PDU上能够监控配电插座上每一个插孔的情况。

2、监控负载机柜的电源状态。用户希望有一些安装在本地的显示装置以提醒维护操作人员可能发生的故障。目前要弄清楚每个机柜上的电源状况是很困难的,但在有些情况下,即使能够查看每个机柜上的电流,也是需要通过远程管理界面来查看。用户希望能够在巡查过程中看到每一个机柜的各个输出插座的电流情况。

3、线缆管理的问题。随着业务的发展,IT设备被不断地追加安装,机柜上的功率密度不断增加,这就必须把更多的电缆连接到配电柜上。如果机柜使用2N设计,机柜就需要有AB两路供电电缆。如果再考虑到高密度服务器数量有进一步增加的趋势,在极端情况下,一个机架上甚至可以安装200多个刀片式服务器。这样就使数据中心的电缆数目大大增加,成为管理和宕机风险方面令管理人员头痛的问题。如何改变电缆的混乱状况,改善电缆的管理水平呢?

4、预防性故障分析的问题。用户一直依赖劳动力密集的预防性维护操作、红外线探测等作为他们检查核实潜在问题的方法,而这些乏味的重复性工作又往往需要受过专业训练、经验丰富的工程师完成。用户希望电源系统应该具备足够的智能水平以及自我诊断能力,以便能够在故障实际发生之前发现并通知这些潜在故障。

六、可服务性的问题

1、减少平均维修时间MTTR的问题。系统的易管理性是减少平均维修时间的前提,但是故障判断后,部件的更换往往是减小平均维修时间的关键。许多供应商提供了并在多数情况下能够完成响应时间的承诺,但问题是赶到现场是一回事,是否携带了合适的备件又是另一回事。如果用户自身在装机时同时购买常用部件,这种情况会有所改善,但用户端的储存条件又不能保证备件的“完好性”,另外,自备配件也会占据用户宝贵的空间。总之,用户希望能更准确地解决故障并尽可能地缩短修复时间。

2、降低系统的复杂性问题。目前的电力设施是非常复杂的,准确迅速地判断故障是非常困难的事情。系统的复杂性会带来两方面的影响,第一,系统越复杂,操作人员和管理人员产生人为失误的可能性就越大;第二,系统越复杂,系统发生故障时对故障进行定位诊断所需要的时间越长。用户非常希望能够降低系统的复杂程度以及提高操作的容易程度。

3、提高使用维护水平。供电设备已经具备的智能管理和通讯管理功能没有得到充分的发挥。权威人士估计对UPS的智能管理和通讯功能的应用率大概只有30%。在UPS供电系统各类故障的起因中,人为原因造成的故障占很大的比例,人为故障的原因可归结为维护人员对所配置的UPS的基本性能了解不够、对UPS监测监控信息和显示功能不熟悉、对UPS运行时的常规维护要求不清楚且对维护规章制度执行不严格等。

6、供应商之间的相互推诿的问题。由于系统的复杂性,设计者和用户要与越来越多的设备厂商打交道,各厂商的设备之间的匹配以及各厂商的工程师之间的配合变得越来越复杂了。当系统中的某一个环节出现问题时,各厂商的工程师往往从自身利益角度出发,而不是从整个系统的角度出发来判断、认定和解决问题。他们往往会自觉或不自觉地推卸责任。争论的焦点往往会从发现问题、提出解决问题的方案本身到发现其他设备的缺陷上面去,甚至有的用户抱怨说,在这种情况下他们已经从一方职员变成为一个必须善于斡旋的“政治家”。用户非常希望能得到一种解决方案,它能减少或消除供应商之间的相互推诿。