APP下载

一种基于策略的云存储系统故障管理方法

2016-05-14马玮骏王强何晓晖祝小康张庆

软件工程 2016年6期

马玮骏 王强 何晓晖 祝小康 张庆

摘 要:为了解决云存储系统故障管理自动化的问题,基于策略管理的思想,提出了基于策略的云存储系统故障管理框架PSF-C,设计了基于XML的云存储系统故障处理策略形式化描述语言CFS-PDL,该语言简单、灵活、可扩展性强,能够适应云存储系统故障处理各类策略要素的形式化描述需求。针对云存储系统故障自动化管理的实现问题,给出了PSF-C的策略映射方法。PSF-C和CFS-PDL的提出为云存储系统故障自动化管理提供了思路,提高了可实现性。

关键词:云存储系统;基于策略的管理;策略描述语言;策略映射机制

中图分类号:TP339 文献标识码:A

文章编号:2096-1472(2016)-06-04-04

Abstract:In order to achieve automatic supervision of cloud storage system faults,the paper proposes the Policy Based Fault Supervision Framework for Cloud Storage System(PSF-C),and designs the Cloud Storage System Fault Supervision Policy Description Language(CFS-PDL).CFS-PDL is featured with simplicity,flexibility,extendibility and good adaptability to meet the policy element description requirements of cloud storage system fault supervision.The implementation of policy mapping mechanism is brought forward.Such work provides ideas for automatic fault supervision in cloud storage systems and improves the implement ability.

Keywords:cloud storage system;policy based management;policy description language;policy mapping mechanism

1 引言(Introduction)

云存储系统(Cloud Storage System)由于访问方便、成本低、规模大、访问量大、存储数据量大等特点,逐步成为业界的研究热点,而如何在云存储系统实施故障的自动监控和自动恢复一直是云存储系统的重要研究方向。基于策略的管理机制是一种常用的方法和手段。

目前策略管理最早用于计算机网络管理系统中,今年来逐步面向云计算、传感器网络、智能设备、内容分发等领域。文献[1]提出了一种策略驱动的赛博网络空间基础设施动态配置配置方法和研发环境,旨在提高网络的可信度。文献[2]提出了一种应用于云存储领域NoSQL系统的策略驱动配置管理系统,提高了HBase数据库系统的性能和吞吐量。文献[3,4]研究了一种应用于多PaaS环境中的策略驱动中间件系统,提供了细化的应用执行方式和应用数据存储,并且支持自定义和自我服务机制。文献[5]提出了一种能够在云计算环境中进行自动化服务水平级别SLA管理的策略管理框架和工具集,该方法在亚马孙EC2系统中进行了验证。文献[6]提出了一种应用于内容分发网络的策略管理机制,该机制在属性图模型的基础上采用策略流实现。文献[7]提出了一种基于策略的智能应用内容提供方法,采用语义WEB、多代理技术以及内容提供中间件实现,提高了内容分发的精确度。文献[8]基于策略管理机制面向移动网络中的视频服务提出了一种内容感知的应用级别公平调度器,能够自动根据上下文信息进行学习并动态调整调度策略。文献[9]研究一种基于策略的中间件解决方案,提供了一种能够集成各类应用和设备的普适计算环境。文献[10]基于策略管理机制研究了RFID系统中防范SQL注入攻击的方法,提高了RFID系统的安全性能。文献[11]基于策略驱动技术,针对移动终端设备提出了一种隐式验证框架PRISM,该框架能够在数据量很小的情况下自动发现有用的行为模式,减少了显示验证的数量。

本文考虑将基于策略的管理机制应用于云存储系统的故障管理领域中,主要针对策略管理框架不满足云存储系统故障管理的要求、暂时没有面向云存储系统故障描述和管理相关形式化描述语言、缺乏从高层策略到底层策略映射机制等问题展开研究,并给出相应的对策和实现思路,使得基于策略的管理机制能够切实应用于云存储系统的故障管理自动化业务中。

2 基于策略的云存储系统故障处理框架(Policy based fault supervision framework for cloud storage system)

首先根据云存储系统故障管理的特点,给出基于策略的云存储系统故障管理框架(Policy based fault Supervision Framework for Cloud storage system,PSF-C)如图1所示。

PSF-C主要包括故障管理工具、故障管理决策器、故障管理执行器以及策略库。

(1)故障管理工具

故障管理工具是策略管理系统面向用户的使用接口,可提供给用户进行策略的增删改查功能,输入可以是各类定义好的故障管理策略,输出是策略库进行结构化策略存储。

(2)故障管理决策器

故障管理决策器是故障管理执行器的请求处理方,处理主要包括策略检索、策略决策,为故障管理执行器提供能够直接执行的相关函数和命令,处理结构将反馈给故障管理工具。

(3)故障管理执行器

故障管理执行器负责实施云存储系统的故障管理,下达到故障管理执行器的都是可以直接被执行的操作命令,执行结果将反馈给故障管理决策器。

(4)策略库

策略库是存储云存储系统故障管理策略的实体,以结构化二维表的形式表示,采用数据库存储。

PSF-C的优势和特点主要在于:

(1)PSF-C中策略库使用SQL的方式访问,比传统使用专用协议的方式相比性能较高,并且具有很强的适应性和可扩展性,也容易被用户接受。

(2)故障管理决策器和故障管理执行器之间采用云存储系统专用通信协议进行通信,相比传统策略管理系统中所使用的COPS协议更加贴合云存储系统故障管理的特性。

(3)故障管理执行器完全针对云存储系统中的各类故障处理方法进行实现,包括故障监控、故障分析、故障处理等。

3 面向云存储系统故障管理的策略定义(Policy definition for fault supervision of cloud storage system)

云存储系统故障管理策略定义方式如下:

一条故障管理策略(Fault Supervision Policy)由七个要素构成,分别为:

(1)标识(PCode):策略的唯一标识。

(2)优先级(PPriority):决定策略执行过程中的优先级。

(3)被管对象(PObject):类似网络管理中的被管对象,但云存储管理系统中的被管对象与网络管理不同,一般包括各类存储设备、元数据服务器、代理服务器,以及数据文件等。

(4)有效性标识(PStatus):标识策略是否能够被应用,无效的策略不可以被实际应用。

(5)事件(PEvent):标识云存储系统中发生的各类故障事件,作为驱动策略管理系统运行的信息源。

(6)条件(PCondition):以表达式的形式标明与事件相关的判断规则,满足该规则的事件才能够触发相应的动作。

(7)动作(PAction):标识云存储系统中进行故障管理的实际操作。

根据策略的定义,可以将某条策略的含义描述如下:

IF EVENTS ON CONDITIONS THEN ACTS。

即对于某个策略,当发生事件时,如果满足条件,则执行动作。

需要说明的是,事件、条件、动作都可以进行组合,即发生多个事件时,可以在某个条件下,触发多个动作的执行。

4 面向云存储系统故障管理的策略描述语言(Cloud storage system fault supervision policy description language)

本文面向云存储系统故障管理领域提出了一种策略描述语言CFS-PDL(Cloud storage system Fault Supervision Policy Description Language),该语言采用可扩展标记语言XML作为描述手段,旨在以纯文本、层次化、易读的方式表示上节中定义的云存储系统故障管理策略,帮助用户利用策略管理机制实现云存储系统故障管理自动化。

CFS-PDL给出了云存储系统故障处理形式化描述方法,策略定义的七要素。举例如下:

根据故障检测结果发现某个存储节点上的文件分块(以采用文件分块存储策略的云存储系统为例)发生损坏,则故障管理系统判断是否能够获取该文件分块所对应文件的所有分块信息,如果可以获取,则根据所有文件分块恢复文件,并重新计算文件分块,替换发生损坏的文件分块,同时记录日志信息。

使用CFS-PDL描述后的故障管理策略如下所示:FileErrorRecoverPolicy1数据文件

[7] Sorici A,et al.Policy-based Adaptation of Context Provisioning in AmI[J]. Advances in Intelligent Systems & Computing,2015,376(5):33-43.

[8] Mmmel O,et al.Policy-Based and QoE-Aware Content Delivery Using Q-Learning Method[J].Wireless Personal Communications,2015,83(1):315-342.

[9] Khaddar M A E.A policy-based middleware for context-aware pervasive computing[J].International Journal of Pervasive Computing & Communications,2015,11(1):43-68.

[10] Abawajy J,Fernando H.Policy-based SQLIA detection and prevention approach for RFID systems[J].Computer Standards & Interfaces,2015,38:64-71.

[11] Ramakrishnan,et al.PRISM:Policy-driven Risk-based Implicit locking for improving the Security of Mobile end-user devices[C].Proceedings of the 13th International Conference on Advances in Mobile Computing and Multimedia.ACM,2015.

作者简介:

马玮骏(1980-),男,博士,讲师.研究领域:云计算.

王 强(1964-),男,博士,教授.研究领域:机械工程.

何晓晖(1976-),男,博士,副教授.研究领域:机械工程.

祝小康(1980-),男,硕士,工程师.研究领域:软件工程.

张 庆(1979-),男,学士,工程师.研究领域:信息处理.