APP下载

数据中心蓄电池自动预防性维护策略探究

2017-03-27

电信工程技术与标准化 2017年3期
关键词:充放电预防性蓄电池

(中国移动通信集团甘肃有限公司,兰州 730000)

数据中心蓄电池自动预防性维护策略探究

张小龙,包静,杨万辉

(中国移动通信集团甘肃有限公司,兰州 730000)

本文分析了现有的数据中心蓄电池使用时间和容量不能达到预期设计的问题进行了探究,针对数据中心电池在多次充放电之后出现损耗的问题,对单体蓄电池的性能进行分析,利用服务器恒功率大小来设定蓄电池维护所需放电恒功率大小的目标,完成数据中心蓄电池自动预防性维护策略。

数据中心;蓄电池;自预测;恒功率策略

1 引言

IDC数据中心发展飞速,一般IDC数据中心的建设会耗费巨大的投资,并且在建设初期就会考虑到未来业务的增长而预留出一定的容量。按照估算的业务量,一般一个机房会放置50-100个机架,每一个机架的负载约为几千瓦,一个IDC中心可能建设多个机房,故IDC机房的负载电量巨大,约在几百到上千千瓦。故数据中心对蓄电池的要求也相应提高,但即使电池的设计寿命可达10年或以上,但基于运行环境和维护等几个方面的因素,其很可能在使用了三年之后就已经开始不怎么好用了。IDC数据机房电池维护是实现最佳性能和电池投资回报的两大重要因素。这就需要蓄电池能过在多次充放电的情况下能够保持性能的稳定性,也需要蓄电池的寿命保持一定的年限,以此减少更换蓄电池的费用,降低建设和维护成本,使IDC数据中心的关键基础设施发挥最大价值。

2 IDC数据中心供电现状

2.1 数据中心不间断供电核心

数据中心供电的发展要求在降低投资成本的同时提高效能转换效率从而降低运营成本。数据中心供电不间断技术的核心就在于不间断电源及其电池技术,因此电池连接的位置也决定了不同的供电架构。目前业界主流的备用电池电压从高到低分别有UPS的四百多伏,到直流电源的380V、240V及48V,甚至电池内嵌到IT设备内的12V等。首先从集中式四百多伏铅酸电池的传统UPS,其次到标准服务器不用定制、240V电池直挂输出母线的240V高压直流技术,接着还有服务器采用定制48V或者380V输入电源的48V直流或者380V高压直流电池直挂技术,最后再到Google等的12V电池直挂服务器主板输入方案。电池越靠近末端服务器主板或者CPU,供电系统越为分散,相应的IT系统也更为分布式;电池越靠近末端,供电系统的定制化程度越高,普通用户规模开展的难度也越大;电池越靠近末端,对IT电源及电池的控制管理水平要求也越高。最后,电池越靠近末端,从电网到CPU供电路径上的转换级数也相应减少,带来更高的转换效率,但可能在低压侧传输损耗又会增加。因此,对比集中式和分布式、高压还是低压,选择不同的供电架构,会很大程度上影响供电系统可靠性、供电效率、造价成本等,还有技术、生态的成熟性以及应用灵活性等。

目前蓄电池主要采用VRLAB(Valve Regulated Lead Acid Battery,阀控铅酸蓄电池)。然而在VRLAB应用的过程中,也显露出了一些缺点,主要问题为其使用寿命没有达到预期。根据资料统计,VRLAB在使用3、4年之后就有一部分难以通过蓄电池的容量监测,很少能超过6年。而如果由于没有定期对蓄电池进行容量测试而忽略蓄电池劣化的问题而造成在停电后才发现蓄电池损坏或放电容量达不到设计要求,从而造成巨大损失。所以数据中心不仅要求蓄电池能够在多次充放电的情况下继续保持性能的稳定性,也需要蓄电池的寿命保持一定的年限,以此降低更换蓄电池的费用,同时降低浪费和对污染。

2.2 数据中心单体电池端电压不平衡分析

鉴于IDC数据机房的供电方式,目前适合于IDC数据机房的供电方式对蓄电池的要求越来越高,但是数据中心电池在多次充放电之后易出现损耗,数据中心IDC电池组在浮充工作时,充电设备对蓄电池组始终给出一个特定的浮充电压值和电流值,在长期的浮充电过程中,由于电池热力学因素(电解液浓度、温度、活性物质的状态等)和动力学因素(电流密度、电池结构、极板成分等)的影响,蓄电池组中各个单块电池的浮充电压必然出现高低不同,也是各单块电池工作状况的集中反映。端电压已经很高的电池有可能已充足了电,如果继续充电将大部分变成热量而损失掉,结果导致该电池失水,甚至热失控而损坏;而端电压比较低的电池,正常的浮充电流已经无法满足其需要,须补充大电流才有可能赶上整组电池浮充电压的平均值。而“均充充电”是无法使端电压严重不平衡的单体电池得到完全平衡的。“均充充电”时,充电设备是按照恒定的电量对电池组中的每个电池进行平均充电,若充电电流或充电时间控制不当,有可能加大电池间的差异。

3 数据中心蓄电池自动预防性维护系统

由于蓄电池平均故障间隔时间与可预防性维护次数成正比,因此考虑通过增加太极直流/交流柔性推挽加速节能供电控制模块,内置蓄电池维护相关策略,可以使IDC数据中心的关键基础设施发挥最大价值。计算机CPU、内存、IO使用率是衡量计算机工作是否正常最重要的几个指标,现有计算机监控系统通过在被管计算机上安装代理程序、使用SNMP等方式定时采集上述指标,如发现服务器待机功率、服务器启动功率、服务器稳定功率、符合蓄电池的放电要求。内置蓄电池自动预防性维护自动启动,来实现在线自动维护功能。

3.1 IDC数据中心蓄电池运行特性

IDC数据机房电池组动态运行过程中,电池的电压不一致性表现十分明显。电池组放电前电压基本一致的电池,在放电瞬间,会出现多块蓄电池的电压差最大可达0.5~1.5V。停止放电时,电池的平稳电压又趋于一致。随着使用时间的增加,各单体蓄电池的电压分散程度增加,经过验证,电池组各单体蓄电池电压的平均值和标准差分布呈正态分布,由于电池本身的差异,串联使用一段时间,就会发生差异,主要表现在各电池电压不同,少则几十毫伏,多则零点几至一伏甚至会更多。因此IDC数据机房电池组动态运行过程中急需要解决两个问题:充不饱和放不完。见图1所示。

以2V铅酸蓄电池为例:

电池3的充不饱:充不饱的体现是其他电池到了电池1本身已经是2.35V,而电池3却停留在2.30V或者更低电压,那么此时充电给出2.37V或者更高电压,那综合来说电池1本身是2.35-2.37=0.2V,而电池3是2.35-2.30=0.5V,因此充电本身就是一个越来越平衡的过程。充不满在经过多次充电会达到电压的平衡。

电池1的放不完:此时电池1是2.35V而电池3已经是2.30V,假设放到1.8V停止,那么剩余时间放电下电池1的放电功率明显高于电池3,也就是多放电自然放电就平衡了。

图1 蓄电池组充电容量图

端电压已经很高的电池有可能已充足了电,如果继续充电将大部分变成热量而损失掉,结果导致该电池失水,甚至热失控而损坏;而端电压比较低的电池,正常的浮充电流已经无法满足其需要,须补充大电流才有可能赶上整组电池浮充电压的平均值。而“均充充电”是无法使端电压严重不平衡的单体电池得到完全平衡的。

3.2 IDC数据中心蓄电池自动预防性维护系统

本方案采取的方法是在安全范围内多冲电多放电,就是在30%~90%这段反复循环。如果是采取过放到5%或者过充电到100%长时间,结果就是可以找出那个一致性最差的电池。依据以上的说明,本方案系统蓄电池组在投入在线运行后,一体化微型模块化数据中心动力环境监控平台根据电池测量单元采集到的电池电压计算出单体电压差均衡度为0.5,也就是蓄电池单体平均电压值大于0.5,当均衡度大于设定值0.5时,一体化微型模块化数据中心动力环境监控平台控制太极直流/交流柔性推挽加速节能供电控制模块切换交直流供电方式,由原来的交流改为直流供电,开关电源监控单元调整电压值低于蓄电池正常的电压值,蓄电池自动进行预防性维护放电,来解决蓄电池充不饱和放不完的问题。见图2所示。

本方案采用服务器最大功率、CPU/内存/IO/PSU使用率、服务器空闲和最大功率的能耗比来组建能耗模型,通过把服务器分为CPU处理器、IO、主存、PSU,构建为多元线性回归模型,服务器=(CPU处理器/IO/内存/ PSU)。本方案主要采用了非侵入式的方法来模拟整个系统的能耗,通过一次性校准阶段,生成能耗模型,并同时采用了有着完全不同的能耗与工作负载特性的服务器进行了对比的基础上加入了系统的环境温度作为影响因子,从而建立服务器运行的功率能耗与蓄电池自动预防性维护工作所需功率能耗充放电时长的关系数据库。在DCIM(Data Center Infrastructure Management,数据中心基础设施管理)蓄电池自动预防性维护调度算法中,描述了整个数据中心的蓄电池自动预防性维护模型,其中计算节点能耗模型采用CPU/内存/IO/PSU使用率的线性模型,交换机模型则是各耗能组件的多元函数来实现。

3.3 IDC数据中心蓄电池自动预防性维护功能实现

服务器运行的功率能耗与蓄电池自动预防性维护电池功能可以分为两步。

第一步是CPU/内存/IO/PSU使用率能耗模型优化,根据预测出的CPU/内存/IO/PSU使用率服务器恒功率负荷曲线,DCIM蓄电池自动预防性维护调度算法得出24h内的服务器恒功率负荷的不同变化区间内最优蓄电池自动预防性维护充放电恒功率策略,即每个服务器负荷恒功率的不同区间内电池是否可进行恒功率充放电维护,即利用服务器恒功率大小来设定蓄电池维护所需放电恒功率大小,从而确定蓄电池现有容量是否符合在线运行所需的蓄电池容量标准与是否达到预防性维护所需的效果。

图2 IDC数据中心蓄电池自动预防性维护系统

第二步是DCIM监控系统服务端启动PSU(Power Supply Unit,电源服务单元)智能关断控制应对策略规则库、蓄电池自动预防性维护应对策略规则库,实现对DCIM PSU开关控制模块实时控制。

根据24 h内的服务器恒功率负荷的不同变化区间内最优蓄电池自动预防性维护充放电恒功率优化给出的蓄电池自动预防性维护充放电策略,以及当前时刻的服务器恒功率负荷值、电池状态等数据,计算出蓄电池充放电恒功率指令并下发给PSU开关控制模块。

4 数据中心蓄电池自动预防性维护调度算法

4.1 蓄电池自动越策维护调度算法概述

蓄电池自动预防性维护调度算法以电池剩余电量或荷电状态为状态随机变量为核心。采用服务器恒功率负荷曲线与蓄电池维护所需放电恒功率曲线的比对规划算法。算法的思想就是将服务器恒功率负荷曲线与蓄电池维护所需放电恒功率曲线进行第一阶段匹配,若相等,则继续比较第二阶段的服务器恒功率负荷曲线与蓄电池维护所需放电恒功率曲线;若不相等,则比较服务器恒功率负荷曲线的第三个阶段是否相符,依次比较下去,直到得出服务器恒功率负荷曲线与蓄电池维护所需放电恒功率曲线最后的不同阶段的匹配结果。该算法可以在能耗模型中考虑电池的物理约束,如充放电恒功率限制,电池中与充放电过程有关的非线性开关电源内部损耗约束,电池电压电流波动约束等;本算法不需要连续函数,且方便使用数据中心管理系统(DCIM)监控系统服务端快速计算求解。

4.2 蓄电池自动越策维护调度算法

首先通过公式计算出蓄电池组中每一节电池需要达到的放电功率,然后通过查找各种型号的蓄电池在规定条件下的放电功率,找到最合适的电池型号,具体计算方法如下:

PL<PB就是指选择出的电池放电功率必须满足负载所需的功率:PVA为标称容量(VA);PF为负载功率因数; η为蓄电池容量放电效率;PL=(PVA×PF)/η就是假设满负载,此时通过标称容量反推出电池组需要提供的总功率; Pnc为每个电池需要提供的功率;N为每节电池总单体电池(CELL)数,n为配置的电池总数:Pnc=PL/(N×n)就是求出每一个电池单体在所设定的情况下平均应该提供的功率。算出了Pnc后,就可以查找蓄电池自动预防性维护调度算法内置电池厂家提供的各型号电池恒功率放电数据表,从中查找到核实的电池型号。

蓄电池恒功率运行充放电维护优化模型中的变量为蓄电池组每次充放电的功率w以及电池每次充放电的起始时问t1(L)和结束时问T2(L),l=1,2,3,…n其中n为电池充放电次数,根据服务器运行负荷曲线及蓄电池当前状况来确定,数据中心蓄电池恒功率运行充放电维护可使电池每15~30天充放电各1次。并通过改变开关电源蓄电池管理参数可灵活控制电池的充放电次数,利于延长电池的使用寿命。min h(i)就是使充放电维护优化效果达到最大化,根据给定的分时服务器运行负荷曲线曲线,蓄电池恒功率运行充放电维护优化模型可给出电池充放电策略。

如服务器运行负荷在低效率模式下工作时,min h(i)则为最小化。

数据中心蓄电池恒功率运行充放电维护优化模型建立过程如下:

约束条件

负荷值约束为:

式中:θ0(x)(x=1,2,…q)为已知的第x个时间段上的预测负荷数据: sign(x)为符号函数,当x≥0时sign(x)=1,当x<0时sign(x)=-1。

当x在S0(y)和Se(y) y=1,2,…q之间时,θ1(x)和θ0(x)与w(y)之和,当x取其他值时,θ1(x)和θ0(x)相等。

时序约束为

功率约束:

其中WM为已知的最大充放电功率限值。

容量约束为:

其中RL和RH分别为已知的电池电量的下限和上限;RO和RF分别为已知的电池电量的初始值和最终值。

5 结论及未来工作

计算机CPU、内存、IO使用率是衡量计算机工作是否正常最重要的几个指标,现有计算机监控系统通过在被管计算机上安装代理程序、使用SNMP等方式定时采集上述指标,如发现服务器待机功率、服务器启动功率、服务器稳定功率、符合蓄电池的放电要求。内置蓄电池自动预防性维护自动启动,来实现在线自动维护功能。

服务器运行的功率能耗与蓄电池自动预防性维护电池功能可以分为两步来完成。第一步是CPU/内存/ IO/PSU使用率能耗模型优化,根据预测出的CPU/内存/IO/PSU使用率服务器恒功率负荷曲线,DCIM蓄电池自动预防性维护调度算法得出24 h内的服务器恒功率负荷的不同变化区间内最优蓄电池自动预防性维护充放电恒功率策略,即每个服务器负荷恒功率的不同区间内电池是否可进行恒功率充放电维护,即利用服务器恒功率大小来设定蓄电池维护所需放电恒功率大小,从而确定蓄电池现有容量是否符合在线运行所需的蓄电池容量标准与是否达到预防性维护所需的效果。

[1] 李坤. 智能充电器及蓄电池维护系统设计与研究[D]. 天津:天津工业大学,2007.

[2] 袁庆龙,高鹏, 马江泓, 等. 阀控密封式铅酸蓄电池的原理及其运行维护[J]. 电源应用技术,2009.

[3] 丁昂. 阀控式免维护铅酸蓄电池脉冲充电技术及其智能管理[D].杭州:浙江大学,2006.

Research on automatic preventive maintenance strategy of battery in data center

ZHAO Xiao-long, BAO Jing, YANG Wan-hui
(China Mobile Group Gansu Co., Ltd., Lanzhou 730000, China)

This paper analyzed the phenomenon that battery life and capacity in data center could not meet the expected design issues explored for the data center. To solve the problem of that the battery capacity lost much after a number of charge and discharge.We analyzed the performance of a single battery. We found a way can achieve goal of the use of the size of the server constant power to set the size of the battery discharge constant power maintenance,and to complete the data center battery automatic preventive maintenance strategy.

data center; battery; self – prediction; constant power strategy

TN915

A

1008-5599(2017)03-0051-05

2017-01-19

猜你喜欢

充放电预防性蓄电池
V2G模式下电动汽车充放电效率的研究
基于SG3525的电池充放电管理的双向DC-DC转换器设计
聊聊蓄电池的那点事儿(1) 汽车蓄电池的前世
蓄电池去哪儿了
蓄电池去哪儿了?VOL12.雷克萨斯RX450h
2015款奔驰R400车预防性安全系统故障
微表处在沥青路面预防性养护中的应用
蓄电池去哪儿了?
馆藏唐卡保管与预防性保护
锂离子电池充放电保护电路的研究