APP下载

云计算平台系统运行模式设计研究

2014-02-09王铁毅

山东冶金 2014年3期
关键词:调配利用率能耗

王铁毅

(山东钢铁集团有限公司信息化中心,山东济南 250014)

信息化建设

云计算平台系统运行模式设计研究

王铁毅

(山东钢铁集团有限公司信息化中心,山东济南 250014)

围绕着基于云架构的企业OA、人力资源、固定资产、档案管理、全面预算、外事管理等业务系统的整体云应用,为获得更加经济、适用的运行效果,实现资源的按需调配与供给,运用模板扩展方式具体定义和创建可自动执行的系统运行模式,以支持绿色节能、高效运行和断电保护,规避潜在的手工操作风险,经试用取得初步成效,并进一步探索了云应用由自动化向智能化提升的可行性。

云计算;云应用;资源调配;自动运行模式

1 前言

数据中心耗能巨大,IT设备特别是服务器约占其中的40%[1]。云计算技术的应用不但为企业带来了更加智能的运算方式,作为一种IT资源服务的获取和交付,在促进企业科学决策、快速创新方面体现着巨大优势,并能帮助数据中心大幅提高资源利用率,减少系统软硬件采购,节省能源开支,实现转型升级和绿色发展[2]。

企业整体云架构的建立,为日后充分发挥IT平台的作用,提供了广泛的发展和想象空间,特别在资源按需调配与供给方面,通过合理操作,提高云平台运行质量和效益,利用有限的资源消费可获得更加经济、适用的运行效果,既能响应不同类型的业务需求[3],又能使系统资源占用更少、能耗开销更低,进而降低IT系统的运营成本和再建投资。但由于资源调配、系统迁移的严谨性和复杂性,在企业具体实施过程中却苦于没有自动化的运行模式而望而却步,因为借助于工具软件的人工离散性操作,尽管事先针对既定目标制定了严密的计划,可稍有不慎也会产生意想不到的后果,甚至导致系统性风险。因此在云平台的实际使用上只按固定的初始运行模式工作,不论工作日、节假日,还是白天、黑夜,甚至不管任务轻重缓急,资源配置固定于初始状态,系统运行不做动态调整,致使云平台应有的作用大打折扣。这就提醒我们,在云平台交付使用时,为获得预期的运行效果并规避潜在的操作风险,必须针对不同的需求确定相应的系统追求目标和资源调配策略,并依此定义和创建一系列可自动执行的运行模式,以全流程完成各既定目标、满足不同需求,这应该作为企业真正实现私有云落地的必然步骤,而不能只停留在固定的初始运行模式阶段,但它的确是一项十分复杂和耐心细致的工作。对此,基于微软System Center 2012建立的企业云计算平台,实现了各类业务的整体云应用,并在系统动态资源调配和优化运行模式方面做了有益的探索,获得初步成效。

2 技术构思

Dell M910刀片服务器CPU利用率与机箱(M1000e+8*M910)总功耗的关系见表1,通过数据分析得知,当服务器CPU利用率由10%提升到80%,系统整体能耗只增加10%;每多开1台服务器,系统整体能耗几乎增加1倍。尽管这一结果或许随服务器的不同而做调整[4],但总的趋势足以说明,由于资源调配策略和运行模式不同,对完成同一项业务的能耗开销和运行效率存在很大差异;服务器CPU利用率可做为平衡云计算平台资源消费和运行效率、制定各类运行模式的基本依据[5]。

表1 Dell M910刀片服务器CPU利用率与机箱总功耗的关系

利用有限的资源获得更加经济、适用的运行效果,须兼顾云平台资源开销与运行效率的平衡。资源配置最大化意味着资源投入最大化,换来的是系统运行和服务响应的高效率;资源节约配置,牺牲的是系统运行的效率和服务响应时间。业务需求性质决定系统追求目标的取舍,要围绕不同的系统追求目标,综合考虑各种相关因素,制定相应的资源调配策略和具体操作步骤,关键在于运用合适的方法,结合软硬件实际环境,创建有针对性的可自动运行模式,使各项资源调配策略得以落地实施。为简化工作、提高效率、减少失误,本案运用模板扩展方式,完成多种自动运行模式的定义和创建,以支持绿色节能、高效运行和断电保护,其中贯穿着“由简到繁、由基本到复杂”以及“细化、优化、固化并可逆化”全过程。其要点有:

1)按软件工程观点,为提高复用率,先创建几个功能相对单一、可供直接调用的基本运行模板,通过调用执行就能自动完成系统基础资源(如CPU、内存、存储等)的调配或迁移操作;2)以基本运行模板为基础,做适当调整、扩充或组合,按实际需要制定功能较为完整、可达既定目标的资源调配策略和操作流程,并形成固化的可自动执行的运行模式;3)兼顾正、反双向操作,既可正向操作完成既定目标,又兼顾反向操作恢复原有状态,进一步降低和消除操作风险。

3 基本运行模板

3.1 自助资源申请

通过平台软件提供的统一服务交付工具和自助服务门户,由需求客户发出计算资源申请,经系统管理员审批、生成和分配计算资源(见图1),实现IT服务的按需申请和自助使用,以此支持业务的快速部署,提高系统管理效率。

图1 资源自助申请流程

3.2 CPU资源动态调配

随着某应用负载增加,虚拟服务器过载将影响正常工作时,系统自动提高过载虚拟服务器的配置,实现了系统的动态资源调度,保证正常的业务处理。具体设定值是当某个在线应用系统的CPU利用率超过60%时,自定义工作流自动触发该虚拟服务器的关机操作,并将CPU配置自动提升为4个CPU并增加适当内存后,重新启动虚拟服务器。自动提高虚拟服务器配置满足过载需求的相关流程参见图2。

图2 虚拟CPU资源动态调配流程

3.3 虚拟机调配

随着工作负载不断加大,当1台虚拟服务器无法满足正常业务时,系统将动态增加虚拟机数量,分担当前虚拟机的负载,支撑业务正常工作,满足大流量系统要求。

具体可利用网络负载均衡集群技术(微软NLB)构建3台Web服务器虚机,先启动其中1台,当这台应用的CPU负载达到设定值60%时,自定义工作流触发启动第2台虚机操作以分担负载,进一步可类推触发启动第3台虚机操作,进而动态增加虚拟机数量,满足大流量系统正常工作。动态增加虚拟机数量支持大流量系统的相关流程参见图3。

图3 虚拟机资源动态调配流程

3.4 虚拟机与物理机漂移

当虚拟服务器的性能无法满足当前应用的快速扩张时,可有计划地将虚拟服务器漂移到计算能力更强的物理服务器上去执行,以保证业务的正常进行。利用Dell的AIM管理软件,按AIM执行计划能够实现虚拟服务器对物理服务器之间的互相漂移,相关流程参见图4。

图4 虚拟机与物理机之间的动态漂移流程

4 系统运行模式

4.1 一般性模式

总结实际工作需要,在分析各类业务应用系统的性质和资源配置需求的基础上,就不同的系统追求目标,结合已创建的基本运行模板,具体定义和设计以下几个更为实用的一般性运行模式。

1)最小化模式。以业务应用系统集中部署为目标,多开虚机服务器,尽可能减少服务器使用数量,此时投用的物理机最少,能耗最低,资源利用率最高,保守设置不低于80%(内存足够大的情况下)。

2)高效模式。为业务应用系统配置足够的资源量,以利其快速、高效地完成任务。为保证业务应用顺畅、毫无障碍的执行,资源量一般按完成任务所需的最大峰值配置,以减少虚拟机资源调配和迁移,该模式下平均资源利用率不超过40%(在内存足够大的情况下)。

3)节能模式[6]。在服务响应可以接受的前提下,以节约能耗为目的,二者兼顾,不断加大任务负载、提高资源利用率并降低服务响应直到用户基本还可以承受,以此作为该模式的资源配置目标。通常情况下,节能模式可能为最小化模式。

4)断电保护模式。确定停电后关掉大部分应用,以保护不宜关停的核心业务能够坚持更长时间的运行。

4.2 智能化模式

基于一般性模式可推演智能化模式。按时间坐标记录各业务应用的资源时序占用值,包括每个应用的CPU利用率、内存消耗、存储大小等,以此按制定优化的资源时序调配计划,并能够自修正、自学习、自适应,使各应用系统始终处于所希望的资源环境下运行。

智能化运行模式虽然只是多一维时间因素,但与一般性模式有很大不同。结合时间坐标将最小化、高效和节能模式组合起来,通过运行环境预设、错峰运行,合理运用有限的资源在合适的时间安排合适的事,进一步提高系统的运行质量和效果,即所谓最佳运行模式,实现系统运行的精准控制。

1)最小化模式运行:安排在系统大修期、设备更换期,或在夜间、节假、公休日。2)高效模式运行:安排在业务处理高峰时段,如刚上班时,或在月末结算时,等。3)节能模式运行:多安排在业务处理量平稳时段。4)最佳模式运行:将上述模式合理组合起来,将生成一系列适合正常工作日、节假公休日、月末结算日的系统运行模式,以闭环、自适应的方式控制云平台系统运行,在保证完成规定任务的同时,用较低资源消费获得最佳效果,进而减少IT系统的运营成本和再建投资。

5 结语

本项目一期云计算系统由12台Dell刀片服务器、一台高性能存储和若干网络设备等硬件组成,部署微软System Center 2012和Dell的AIM等软件,构建了整体云应用的云计算平台和云数据库资源,已迁入并正常运行的有OA、人力资源、固定资产、档案管理、全面预算、全面风险、外事管理以及内网网站等十几套业务系统,业已通过有省关部门组织的技术鉴定。基于该应用实例,利用微软3个公共组件SCOM+ORCH+SCVMM,创建了基本运行模板和一般性运行模式,通过验证性运行,结果分析表明,系统运行的技术经济指标明显改善,需要投入的计算资源大幅减少,能耗大约是传统单机方式的1/7,与云平台初始模式相比可节能19%~23.7%,后者主要来自夜间或非工作日的最小化模式运行,扩大内存优化配置后运行效果会更为明显。

[1]谷立静,周伏秋,孟辉.我国数据中心能耗技能效水平研究[J].中国能源,2010(11):42-45.

[2]过敏意.绿色计算内涵及趋势[J].计算机工程,2010,36(10):1-7.

[3]陈廷伟,周山杰,秦明达.面向云计算的任务分类方法[J].计算机应用,2012,32(10):2 719-2 723.

[4]张桂林.主流刀片PK能耗[EB/OL].(2010-09-19)[2014-05-26].http://server.zol.com.cn/196/1967447.html.

[5]雷成军,罗亮,吴文峻.基于云计算的集群能耗监控与节能方法[J].计算机应用与软件,2011,28(11):242-244.

[6]徐骁勇,潘郁,凌晨.云计算环境下资源的节能调度[J].计算机应用,2012,32(7):1 913-1 915.

Design and Research of Operating SystemModel Based on Cloud Computing

WANG Tieyi

(The Information Technology Center of Shandong Iron and Steel Group Co.,Ltd.,Jinan 250101,China)

Based on overall cloud computing framework,around comprehensive cloud application of enterprise OA system,human resource,fixed assets,file management,overall budgeting,foreign affairs management system etc.,and in order to get more economic and efficient operating result,define and build an automatic operating model for allocation of resources to support green energy, effective operating,and avoid artificial risk,the operation model of cloud computing system was researched and designed and the possibility of raising automatic cloud to intelligent cloud was explored further.

cloud computing;cloud application;allocation of resources;automatic operating model

TP393.09

B

1004-4620(2014)03-0054-03

2014-02-11

王铁毅,男,1961年生,1984年毕业于鞍山钢铁学院计算机科学专业。现为山东钢铁集团信息化中心副总经理,高级工程师,从事大型企业集团数据中心及IT基础架构的研究应用工作。

猜你喜欢

调配利用率能耗
120t转炉降低工序能耗生产实践
能耗双控下,涨价潮再度来袭!
养猪饲料巧调配
探讨如何设计零能耗住宅
大气调配师
2019年全国煤炭开采和洗选业产能利用率为70.6%
化肥利用率稳步增长
日本先进的“零能耗住宅”
浅议如何提高涉烟信息的利用率
板材利用率提高之研究