APP下载

基于云计算技术的数字图书馆云服务平台架构设计

2015-05-15

电子测试 2015年8期
关键词:服务平台虚拟化数字

杨 毅

(四川护理职业学院,四川成都,610100)

云计算技术具有很多优点,如虚拟化、规模超大、可扩展性高、易用性、价格低廉价、按需服务等,因此,在数字图书馆服务共享平台建设中应用云计算技术,可以提高资源的利用率和共享度。

在数字图书馆建设中应用云计算技术可以实现以用户为中心,显著提高用户的服务体验,并且对用户的终端设备要求不高,使用简单,用户通过简单的操作即可获得服务平台中的服务和信息。由于云计算的应用性较强,因此,为图书馆今后的发展方向提供了全方位的指导。图书馆中存储了大量的数据信息,因此可以利用强大的互联网无线功能和当前的服务器资源开展全天候24小时无限制的信息服务,在最大程度上提高图书馆信息的利用率和开放存取。因为全球的数字图书馆都可以通过图书馆云服务平台整合每个图书管的特色馆藏资源,形成一个超大的综合信息库,最大限度的提高信息资源共享度,因此,图书馆的“云”时代即将到来。当前,我国进行数字图书馆建设的单位主要是高校,其侧重点在于学术资源共享,而对于平台的天文信号分析和数据挖掘等方面的研究。

1 云计算的服务模式和系统结构

1.1 服务模式

云计算的服务模式主要包括3种服务模式,分别为IaaS(基础设施即服务)、SaaS(软件即服务)、PaaS(平台即服务)。

(1)IaaS:“云端”基础设施是由多台服务器集群组成,用户可以通过互联网按量获取服务。它提供的服务主要包括虚拟化服务器和存储资源等,商家提供硬件设施,用户付费即可使用,这种服务被称为托管式的硬件服务。其实质就是出租基础设施服务,具有代表性的此种类型的云服务为IBM的“蓝云”服务和Amazon Web服务。

(2)PaaS:这种服务模式是将提供的服务是软件开发环境和研发平台,将这些设施提供给客户,客户自行开发应用程序,然后这些程序通过互联网共享使用。从实质上来讲,PaaS和SaaS为用户提供服务的模式一样。但是,PaaS提供的服务是软件开发平台,SaaS提供的服务是应用软件。具有代表性的PaaS有Google App Engine(Google公司)和Salesforce的force.com平台。

(3)SaaS:此种服务模式为用户提供的服务是应用软件。服务提供商将自己提供的应用服务统一放置在自己的“云端”服务器上,通过互联网将这些信息提供给用户,用户根据自身需求付费进行订购,此种服务使用简单,通过浏览器即可。具有代表性的这类服务包括Zoho Office、Google Apps、Google Doc等。

图1 基于云计算的数字图书馆系统的整体结构

1.2 系统结构

云计算的系统结构主要包括3部分,分别为主服务器节点、子服务器节点、客户端。

主服务器节点的主要功能包括检测容错、负载均衡、数据映射及任务调度等,并对子服务器节点进行调度和管理。子服务器节点的主要功能为高度并行的数据存储和计算处理,所有数据资源汇集到此进行处理,形成一个工作资源池,它和客户端直接进行数据交换,采用虚拟技术使资源利用率不断提高,达到最大化。由图1可知,“云”服务器包括子服务器节点和主服务器节点,向客户端提供Paas、IaaS、SaaS三种类型的服务。云计算Hadoop构架主要包括MapReduce编程、HDFS、HBase等。MapReduce编程主要包括一些算法,对数据进行并行处理,而HDFS、HBase则是对数据进行读取和存储。用户登录之后,通过客户端可以使用云计算的相关服务,向应用层提出相关的请求,请求结果也通过客户端传递给用户,此外,客户端除了登录之外,用户还可以进行注册或者是定制某些服务。

2 构建云计算下数字图书馆的关键技术

云计算技术是在计算机技术和网络技术的基础之上发展而来,扬长避短,充分结合了二者的优势,其技术实质是将IT软硬件资源如服务器、应用软件等虚拟化,其主要关键技术主要包括以下4方面。①虚拟化技术。这种技术主要是通过新增的虚拟中间层截获上层软件对底层接口的调用,并重新对该调用做出处理和解释,这样可以在异构环境中实现资源的协同、管理和共享,同时还能够实现应用的运行维护、迁移和部署。②海量数据管理技术,该技术提出了基于Map.Reduce的编程模型,提高数据处理的速度,并获得可靠的数据处理结果。③分布式数据存储技术,这种技术使用多台机器的存储空间,将这些不同机器的存储空间虚拟成一个存储设备进行存储,抽象表示存储资源,并对它们进行统一管理,确保存储资源的读写操作安全。④分布式计算和并行计算。分布式计算研究的是怎样将一个十分复杂,需要巨大计算能力才能解决的问题分成许多小的部分,然后把这些部分分配给一个计算机集群进行处理,然后收集问题处理结果,最终得到大问题的处理结果。并行计算(Parallel Computing)是指同时使用多种计算资源解决计算问题的过程。强调的侧重点是时间同步。当前比较成熟的并行模式主要包括3类,分别为分布存储模式、共享存储模式、共享存储与分布存储混合模式,其相应的程序设计也可以分为3类,分别为基于消息传递程序设计,典型代表为PVM和MPI;共享程序设计,典型代表为OpenMP;混合编程模式,典型代表为MPI+OpenMP。

3 数字图书馆平台需解决的问题

基于云计算的数字图书馆云服务平台集合了很多优质的知识资源,是知识中心,使用十分方便、无时间和空间限制,可以实现智能检索和跨库无缝链接。为了降低平台的构建成本,实现多媒体信息的无障碍传播,一定要解决以下几个问题:一是,建设的平台具有通用性,能够满足多种类型的数字图书馆建设项目的共性需求,并能够抽象成最小的独立功能单元;二是,对数字图书馆平台运行机制进行研究,如资源表现方式、资源浏览方式、资源元数据信息的描述和资源编辑方式等等;三是,能够适应不同的环境,满足不同用户的特殊要求,通过某种机制定制平台的特征以适应实际情况;四是,平台构建的数字图书馆不是孤立存在的,是相互联系的,通过一定的通讯机制相互浏览和获取信息,提供系统扩展需要的应用接口,实现系统的统一登录入口。

4 基于云计算的数字图书馆系统设计

基于云计算技术构建的数字图书馆云服务平台是一种对用户透明的服务平台,该平台可以为不同的终端用户提供不同的服务界面,存在相应的接口支持本平台的应用程序开发。不同的用户平台的访问使用方式不同,普通用户可以直接通过用户界面访问该平台,专业用户可以通过调用平台的开放应用接口使用多样的单元服务。用户在使用平台时,不需要了解其运行机制和功能的实现,只需要根据自己相应的功能需求选择功能单元即可,并将功能需求通过任务的形式提交给平台,平台自动执行,实现用户的功能需求。

数字图书馆平台内部功能模块主要是通过开放应用接口和用户界面两种形式为用户提供服务。为了提高平台的数据信息安全性,开放应用接口提供的服务为透明服务,但是对于一些机密信息,如系统管理等系统安全权限等,只能通过平台的用户界面进行调用,用户界面也可以通过调用应用接口对能够调用的外部程序进行调用。基于云计算的数字图书馆系统的整体结构如图1所示。

4.1 基于云计算的数字图书馆服务平台架构

数字图书馆服务平台的建设主要包括计算资源、数字信息资源、应用系统、存储空间及操作界面等。平台从上到下包括用户层(客户端)、服务层、数据处理层、虚拟化层和物理资源层。

(1)物理资源层

物理资源层处于平台的最底层,主要包括CPU资源、网络资源、计算资源、存储资源、I/O资源等。

物理资源的结构和规模是一种固定的形式,不能随意对其进行更改,因此,需要采用虚拟化技术整合相关的资源,这样才能更好的为上层服务。

(2)虚拟化资源层

该层主要是利用虚拟化技术对物理资源层进行整合,将CPU、服务器、存储、网络、I/O等进行抽象、转换,将它们转换成虚拟化资源,使云计算平台的资源调配更加灵活,用户能够更好的应用这些资源。虚拟化资源层包括应用虚拟化、存储虚拟化、计算虚拟化、网络虚拟化、服务器虚拟化等。存储虚拟化依靠分布式存储技术和网络文件系统技术实现。计算资源包括CPU资源和内存资源,因此其虚拟化包括前述两部分的虚拟化。网络虚拟化是让一个物理网络能够支持多个逻辑网络,虚拟化保留了网络设计中原有的层次结构、数据通道和所能提供的服务,使得最终用户的体验和独享物理网络一样,同时网络虚拟化技术还可以高效的利用网络资源如空间、能源、设备容量等。基础设施层由虚拟化资源层和物理资源层共同组成,为了降低平台的建设成本,该层可以使用开源技术进行构建。可以选择OpenStack构建基础设施层,因为它的功能十分强大,商用评估较好,虚拟化技术支持程度较高,兼容性、扩展性和灵活性较好,采用分布式和异步体系结构,支持多种虚拟机镜像和iSCSI存储容器管理等,使用户更加快速的构建云基础设施。

(3)数据处理层

数据处理层主要是对各种数据进行处理,包括数据库访问模块和各种异构数据库。在云计算的环境下,构建的数字图书馆服务平台利于最大程度的实现资源共享,该层即为应用服务层提供支撑,又对基础设施层进行抽象封装。该层基于云计算的PaaS来实现和部署,提出了数据处理接口,它是数字图书馆提供个性化信息的核心层,并对资源进行合理的调度和优化处理,最终提供给用户使用。用户向数字图书馆提出服务请求,数据处理模块对用户需求进行分析和细化,资源调度模块根据细化后的需求动态的调度合适的资源给用户[70]。

(4)服务层

服务层包括用户管理服务、邮件管理服务、门户网站服务、搜索引擎服务、图书管理服务、安全管理服务、借阅管理服务、信息发布服务。用户管理服务主要是对用户进行管理,包括查询用户、增加用户、删除用户、修改用户,并且不同用户的管理权限也不相同。借阅管理服务主要是管理相关的纸质图书资料。安全管理服务主要是验证用户的身份,确保平台中的资料安全,角色不同其访问权限也不相同。搜索引擎服务主要是检索学术资源,并对其进行下载,信息发布服务可以进行书刊,并发布相关的图书信息,进行专题订阅等。资源管理服务主要对相关资源如网络资源、存储资源、计算资源进行回收、调度、配置和动态部署等进行管理。服务层可以通过J2EE平台实现,该平台可伸缩性较强,能够支持异构环境,能够对J2EE平台进行快速构建。

(5)用户层(客户端)

用户通过相应的门户可以访问云服务,比如手机、计算机、平板电脑等,因此需要对内外部服务进行汇总,定制个性化服务,针对的门户设计不同的显示界面。用户显示界面的设计和设置可以应用JSF(Java Server Faces)技术实现。采用JSF技术构建用户界面的开发模式选择组件模式和事件驱动模式,并以组件为中心,使Java Web应用程序的开发变得比较简单,提高了Web应用程序的构建速度,使开发的程序更具有业务逻辑性。

4.2 数字图书馆平台的功能结构划分

根据数字图书馆的功能需求,其功能模块主要设计为以下四个:数图构建模块、电子书借阅模块、电子书阅读模块、后台管理模块。数图构建模块包括:创建机构馆子模块、图书分类子模块、数据同步子模块、站点镜像发布子模块;电子书借阅模块:U盘借阅子模块、借阅流程子模块及移动硬盘借阅子模块;电子书阅读模块:在线阅读子模块和离线阅读子模块;后台管理模块:用户身份管理子模块、电子书管理子模块、权限管理子模块、副本数管理子模块。

5 数字图书馆云服务平台的服务流程

5.1 信息资源描述

用户通过客户端向云服务平台发出请求,以WEB形式提供服务,用户可以随时在网络条件下对数字图书馆进行访问,同时也和Web云上的用户共享流量和计算能力。用户发送动态请求驱动云服务平台,云服务平台接收请求之后,采用描述语言对其进行描述。

5.2 信息资源匹配

描述信息资源时,可以在数字图书馆节点平台所提供的信息资源云中通过信息资源发布和信息资源发现两种方法寻找匹配的信息资源。在进行资源匹配时,云服务平台通过虚拟技术对虚拟硬件的存储和计算能力进行动态部署,为了确保数据信息的完整性,部署的同时优化多功能负载。

5.3 信息资源调度

因为数字图书馆节点中存储的资源都进行统一设置,因此,只要输入需要资源的信息名称即可进行行信息资源预置。信息资源预置和记录器的作用相差不多,能够将记录用户所需要的所有信息资源,能够实现多个信息资源的并发存取和对信息资源的保证存取,保证用户所需要的安排执行应用全部信息资源。

5.4 信息资源发布

数字图书馆云服务平台对用户需求的匹配信息资源进行状态估计,也就是使用当前的历史数据库和信息资源的状态信息提供任务调度信息。按照云服务平台的控制任务要求,在“云”中运行的资源云集群提供用户需要的资源。

图2 数字图书馆云服务平台运行机制

综上所述可知,数字图书馆云服务平台的主要服务流程为信息资源描述、匹配、调度、发布。

6 数字图书馆云服务平台的运行机制

6.1 数字资源采集机制

数字图书馆云服务平台提供了数字资源的采集机制。由于每个节点平台中都存储数字资源,因此需要采用按需检索的方法对信息进行采集,但是,对于一些没有进行统一管理的分散资源则没有必要集中。用户检索时,只能看到统一的平台检索界面。用户使用云服务平台,提交查询请求之后,云服务平台动态的将这些请求分配到每个节点的云平台之中,然后对信息资源进行采集和调度,再根据用户需求进行选择、集成和整合。这样的采集方式,先对信息进行筛选,将重复信息删除,这样不会出现重复存储的现象浪费存储空间,用户也能够更好的利用数字图书馆提供的服务。

6.2 数字资源组织与管理机制

数字资源组织与管理在数字图书馆云服务平台的运行中非常重要,处于核心地位。在部署数字图书馆云服务平台时,应用的核心软件较多,比如数据库虚拟化技术,它将应用程序组件和信息源、磁盘、计算机等单个资源根据类型集中在一起,云服务平台的子节点服务器系统也需要构建一个从属的平台或者是运行一个模型,使用时更加协调。对于云服务平台子节点平台中的异构数据资源则由主节点平台进行集中管理和调度。为了确保各个节点平台的数据资源共享并提高云服务平台的信息搜索效率,需要对节点平台的数据资源进行管理,重新利用元数据收割技术建立表单。云服务平台通过对节点平台的数据资源进行有效调度和管理,数据经过优化整合之后,进行共享、查询、保存、解析、关联、管理等一系列过程,这样可以满足用户的个性化需求。数字资源组织管理机制主要有两方面的作用,一是,自动分配工作负载,高效利用闲余计算容量;二是,随时增加计算容量。

6.3 用户服务机制

数字图书馆云服务平台的组成主要包括两部分,分别为提供服务必须的应用程序和软硬件基础设施。利于虚拟化技术,云服务平台可以为用户提供统一的操作系统和相应的应用软件程序服务。用户提交服务请求信息,云服务平台对用户请求进行解析和规范化处理,同时将其发布到节点服务平台,节点服务平台根据任务调度,查找子平台中的匹配信息,查找之后汇总、信息,云平台对反馈回来的数据信息进行整理,如分类、提取等,信息整理好之后,发布给用户。

6.4 运行机制的相互作用机理

数字图书馆云服务平台的运行机制包括以上三部分,这三种机制之间是相应作用和联系的,缺一不可。它们之间的相互作用机制如图2所示。由图2可知,数字资源采集机制先采集到用户需要的信息,然后数字资源组织和管理机制对这些信息进行管理,任务调度和分配管理,最后通过用户服务机制将这些信息发送给用户。信息采集是基础,信息组织和管理是核心,数字资源组织和管理机制除了对信息进行管理之外,还要对用户进行管理,并且确保信息资源的安全性。用户服务机制主要功能是对用户进行服务,发送用户的请求,展示用户需要的数据信息,这些信息通过WEB界面提交给用户。数字图书馆云服务平台的运行机制之间相互协调与配合,一个机制出现问题会引起关联反应,导致云服务平台不能正常运行。

7 结束语

本文主要对数字图书馆云服务平台的构建进行了阐述。随着科学技术的发展,云计算系统变得更加成熟,其应用也越来越广泛,数字图书馆也将会向着云服务的建设方向发展,并且得到了重视。图书馆作为一个信息资源的集合机构,含有大量信息,其信息化程度越高,越能为用户提供优质服务。云计算正是一种将海量信息有效集合在一起的技术,将图书馆和云计算机优势完美结合,通过互联网规整各个图书馆的零散信息,对其进行统一,实现数字图书馆的资源融合和信息利用率,不断探索,适应时代的发展需要,增加自身竞争力,为用户提供个性化的优质服务。

参考文献

[1]喻昕,王敬一.基于云计算技术的数字图书馆云服务平台架构研究[J].情报科学,2011,29(7):1049-1053.

[2]裴红罗,王运圣,江洪涛,等.基于云计算的数字图书馆平台架构设计[J].中国农业科技导报,2010,12(6):126-129.

[3]陈宫,牛秦洲.基于云计算的数字图书馆信息服务平台[J].情报科学,2012,30(5):684-687.

猜你喜欢

服务平台虚拟化数字
打造一体化汽车服务平台
江苏省一体化在线交通运输政务服务平台构建
论基于云的电子政务服务平台构建
基于OpenStack虚拟化网络管理平台的设计与实现
对基于Docker的虚拟化技术的几点探讨
基于云计算的民航公共信息服务平台
答数字
H3C CAS 云计算管理平台上虚拟化安全防护的实现
数字看G20
存储虚拟化还有优势吗?