APP下载

PUE 值在数据中心能耗管理中的应用

2019-12-25

通信电源技术 2019年12期
关键词:数据中心服务器基础设施

黄 坚

(广西壮族自治区信息中心,广西 南宁 530000)

0 引 言

本文将讨论一个最流行的指标,即“电源使用效率”(PUE),并介绍了使用PUE 进行能源使用交流所涉及的一些问题,以及如何解决这些问题。

1 数据中心

数据中心可以定义为集中放置的电子信息设备提供运行环境的建筑场所,可以是一栋或几栋建筑物,也可以是一栋建筑物的一部分,包括主机房、辅助区、支持区行政管理区等。主要功能是容纳IT 设备的任何空间,尽管多功能建筑中的一个小计算机房也可以被看作是一个数据中心,但这个术语通常用于描述那些唯一目的是容纳这些服务器的建筑。通常,人员密度决定于小型信息技术(IT)支持团队,这些团队可能在建筑内拥有办公空间。相对于建筑的总体量,这些办公空间较小。从建筑的角度来看,这些设施与大多数建筑有很大的不同。例如,在数据中心中,机械和电气系统占建筑成本的70%,而在商业建筑中,这一比例仅为15%。

当今的数据中心主要用于互联网或基于网络的活动。它们包含存储和处理电子数据、与其他计算机网络通信以及/或与基于服务器的软件工具和web 门户管理用户交互的服务器。通常,数据中心用于管理敏感或重要的数据和操作,如电子邮件通信和公司/政府数据库。因此,可靠性(即服务器正常运行而不丢失数据的能力),对于许多数据中心来说是一个关键问题。这种可靠性不仅与所使用的服务器的特性密切相关,而且与数据中心基础设施密切相关,其中包括配电、机械,即暖通空调(HVAC)系统。也就是说,服务器需要持续的电力供应,并且在一定温度下运行时不容易受到硬件宕机的影响。(需要注意的是,服务器可以产生大量的热量,因此数据中心通常有大量的制冷负载)。因此,除了冗余计算配置,大多数设备使用冗余的配电网络、不间断电源(UPS)、自动转换开关(ATS)设备即专业的机械冷却系统,将服务器故障率降到最低。配电网和机械系统的冗余度常被用来对数据中心的可靠性进行评级和比较。这称为数据中心“Tier等级”或者国标GB50174 中的分级,其中更高的等级表示更大的冗余。通过电力/冷却冗余、UPS 和ATS装置的应用增强了数据中心电能使用的可靠性。相比之下,其他建筑通常不需要这样的冗余和设备。此外,数据中心操作人员通常在设施允许范围内,通过最大化服务器的数量来优化楼层空间的使用。因此,数据中心往往具有较高的功率密度,有时大于2 kW/m2, 而典型写字楼的功率密度为75 ~108 W/m2。因此,尽管数据中心的数量远远少于其他建筑和能源负荷,但在2018 年,数据中心的用电量约占全球用电总量的 2.5%~3%[1]。

1.1 数据中心能效

根据章节1 可知,数据中心会消耗大量电能,使电网不堪重负,并产生大量电费。随着能源可持续性、经济环境的恶化,越来越多的社会运动推动数据中心行业更好地评估和沟通能源使用情况,以提高能效的普遍预期。许多实业家探讨了数据中心能源设计相关的基准测试和优化的方法。建立了以数据中心为研究对象的机构,如7*24Exchange、The Uptime Institute 及DCD 等。这些组织跟踪和报告数据中心的能源使用情况,召开会议并发布关于数据中心能源相关事项的出版物。此外,一些组织还提议调整以数据中心为主要对象的可持续性评级系统。

为了理解和比较数据中心的能源使用和效率,引入了许多指标,两个流行的指标具体如下。

(1)每瓦特的IT 生产力(IT-PEW),它表示服务器的电力效率,是运营商希望最大化的指标。

(2)PUE,它类似于数据中心基础设施效率(DCiE)和场地基础设施能效(SI-EER)。这3 种指标都试图量化基础设施系统的电力效率,并且都是运营商希望最小化的指标[2]。

PUE 是评级/排名讨论中最常用的指标。运营商在发布有关数据中心能源效率的声明时,经常吹嘘自己的PUE。The Uptime Institute 等组织通过调查,跟踪和报告数据中心的平均PUE。PUE 也被作为制定能源可持续性标准的指标被提出。然而,在试图理解数据中心的完整能源概况时,PUE 也存在问题。

2 电源利用效率(PUE)

PUE 表示数据中心消耗的总功耗Pt与计算机服务器使用的功耗Ps之比,即:

Pt和Ps的区别在于非计算类系统,也就是数据中心基础设施的占比。这包括暖通空调系统消耗的电力和由于载流导线的电阻而造成的电力损失,以及配电系统中元件的低效率。系统除ATS 和UPS 设备外,通常还包括变压器、配电盘及电源分配单元(PDU)。图1 为一个数据中心的供配电系统示例图,可以更好地表示功率转换和损耗及低效的来源。如果服务器消耗的电能占传输到数据中心的全部电能,那么PUE=1。由于数据中心的目的是安放这些服务器,因此从电力使用的角度来看,PUE 为1 表示数据中心在电能利用方面具有100%高效率。此外,PUE 不可能小于1[3]。

图1 数据中心的供配电系统示意图

Uptime Institute 的调查数据显示,2007 年,全球数据中心PUE 平均值为2.5,2013 年PUE 已经降低了1.65,最新的数据显示,2018 年全球数据中心PUE 为1.58。这得到了数据中心电力消耗故障研究的进一步支持。研究表明,数据中心全部电能的大约56%由服务器消耗,30%由制冷系统消耗,13%由电网和空调设备消耗,1%用于照明,那么PUE 为1.79。在项目的建设阶段,可以从多个方面来改善PUE,如使用更节能的基础设施系统。但是,如果在运行过程中照明被关闭,或者PUE计算中没有考虑照明负载,会发生什么情况?在本例中,差别很小,新的“PUE”是1.77。然而,这样的不一致性是影响PUE 确定和报告的问题之一。

2.1 PUE 测定相关问题

PUE 的确定以及使用指标和比较数据中心设施的方法还存在一些问题或挑战。一个更基本的问题是:在确定构成Pt的基础设施组成时存在不一致性。有些人认为Pt表示进入数据中心的“有用”电源,该数据中心用来专门支持计算机服务器的持续运行。基于这个观点,在确定Pt时可能不考虑如照明、安全、甚至某些机械设备(这些设备并不总是需要冷却服务器空间)等系统,从而产生更好的PUE 值。对于如何处理现场产生的电力,也可能存在一些疑惑。一个密切相关的问题是确定功率流图中的一个节点定义Pt。例如,由于功率流程图图1 所示,如果Pt被定义为在电力变压器的输入,那么相对于Pt定义为变压器、ATS、主配电盘的输出,数据中心的PUE 将更糟糕。对于多用途建筑物中的数据中心来说,因为这些建筑物中的服务器的配电系统与其他建筑物系统共享,识别Pt节点可能会更加麻烦。目前已经提出了若干建议,以简化PUE 测定中考虑的因素。此外,为解决这个问题,还提出了“部分PUE”(pPUE)指标,通过定义数据中心中的空间和电气分区(如服务器层区域),并确定每个区域的pPUE。不幸的是,虽然pPUE 可能适用于多用途建筑的房间,但是每个区域的pPUE 之和可能并不代表该设施的整体PUE[4]。

在数据中心建设阶段所做的PUE 估计可能非常不准确,除非考虑了各种细节。工程师经常使用基础设施组件的满负荷铭牌等级来确定其设计中的低效率和由此造成的功率损失。然而,电力系统和暖通空调设备通常是针对最坏的极端情况而设计的(以符合大多数建筑法规),因此其经常运行在过载或轻载情况下。当负载不足时,这些设备的效率往往低于其满负荷铭牌额定值。因此,满负荷工况下的评估可能夸大了数据中心的效率,导致PUE 值高于真实系统能够达到的值。为了解决这个问题,工程师可能需要获得与工作负载和效率相关的制造规格,并为所有关键设备制定精确的负载估计。更复杂的问题是,基础设施部件产生的热量,如在冷却空间中布线发出的热量,在评估暖通空调运行条件时,必须对其进行建模并加以考虑。此外,很难将工程估算值与运行过程中获得的功率读数进行匹配。在没有接近满载的情况下,功率传感器可能很不准确。由于许多传感器工作在过载情况下,会导致电能计量数据不可控的偏差,从而影响 PUE 的估算。

与PUE 相关的还有其他几个问题。例如,IT 专家在数据中心运营中可以利用虚拟化技术,通过减少服务器的使用来降低总能耗。然而,这些活动减少了Ps,因此增加了PUE,因为基础设施组件所使用的电力可能不会随着Ps成比例地减少。此外,基础设施设备的效率可能会降低,因为它们在欠载状态下PUE 会进一步恶化。除非在PUE 中考虑服务器运行因素,否则相对于简单地交流数据中心的总电力使用或电力密度,PUE 在能源评级审议中信息价值更小。对于那些将相关能源决策建立在最小化PUE 之上的系统管理员,这些情况还会使他们感到困惑。然而,针对本文讨论的目的,PUE 最关键的问题可能是——PUE 是一种功率指标,而不是(直接的)能量指标。此外,与PUE报告相关的行为会对数据中心能效产生严重误导。

3 能量评级和法规的建议

如果在PUE 计算规则中严格设置了相关因素、考虑服务器使用率,那么PUE 是一个方便的度量标准,它可以巧妙地捕获数据中心中基础设施系统的电力开支。从交流的角度来看,在数据中心运行过程中通过测量获得PUE,也许比在工程估算中获得PUE 的方法更好,除非后者详细分析了设备负载特性。然而,这可能意味着使用更有效的电力传感器或增加测量系统,这两种方法都会增加建设成本。

PUE 要想有效地捕捉能源消耗,就必须改进以体现时间的影响。这可以通过强制PUE 报告必须表示在一个重要的时间段内观察估算PUE 采用的平均时间来实现,如至少一年时间,以考虑季节的变化。这一建议类似于其他研究人员和实业家提出的调整PUE 来表达低效率峰值的建议。在一个重要的时间段内,对PUE 进行长期持续观察或工程分析可能有助于识别和改善能源使用情况。

4 结 论

本文探讨了PUE值在数据中心能耗管理中的应用,并给出了能量评级和法规的建议,以供参考。

猜你喜欢

数据中心服务器基础设施
农业基础设施建设有望加速
公募基础设施REITs与股票的比较
浅析数据中心空调节能发展趋势
服务器组功能的使用
前7个月国内充电基础设施增加12.2万台
理解Horizon 连接服务器、安全服务器的配置
关于建立“格萨尔文献数据中心”的初步构想
PowerTCP Server Tool
新政府会计准则规范公共基础设施处理
计算机网络安全服务器入侵与防御