APP下载

数据仓库在科研管理中的应用研究

2013-12-26严颖波

科学时代·上半月 2013年12期
关键词:数据仓库科研管理应用

严颖波

【摘 要】现阶段,我国的科研工作受到越来越多的重视,伴随着先进技术的快速发展,数据仓库在科研管理中的应用也越来越广泛。通过数据仓库来实现对科研资源的整合、查阅及管理工作,同时,依靠数据仓库也可以更好地实现科研档案管理,以科研动态为基础,及时更新数据仓库,能够保持数据仓库的时效性。数据仓库在科研管理中的应用,进一步优化了我国科研管理工作,本文重点探究一下科研管理中,数据仓库的具体应用。

【关键词】数据仓库;科研管理;应用

在科研项目质量管理中,科研数据以及科研资源的管理、科研档案管理等等,都是其中的重要组成部分,通过数据库,实现对科研管理的规范化、科学化,同时,也应当努力规范和提高科研管理运行机制,健全约束机制,完善科研项目的管理评标体系,这都是提高我国科研管理水平行之有效的途径。

一、数据仓库概述

数据采集是数据仓库构建中的重要内容,从数据源中抽取所需要的数据,然后对抽取到的数据进行清洗,将其按照一定的数据仓库的模型,放到数据仓库中。数据采集中的数据抽取其实就是数据源接口,数据源接口从不同的系统中抽取所需要的数据,将其作为数据仓库的输入数据,数据转换是对不同系统中生成的数据源进行处理,保证这些不同的数据源可以按照规定的要求输入到数据仓库中。数据清洗是对所有的数据进行处理,使得数据集中的所有数据值保持一致,并可以正确的对这些数据进行记录。而数据的装载是按照一定的模型将以上经过数据抽取、转换、清除的所有数据装入数据仓库中,在数据进入数据仓库的过程中还包括了将数据域清除、对数据进行有效的检查等。

二、数据仓库在科研管理中的应用研究

(一)数据仓库的核心技术——ETL技术

在科研管理中,管理人员需要随时获取所需要的数据和信息,因此,通过数据仓库,将外部数据和内部数据进行整理和储存,并且为数据的查询提供了极大的便利。但是这些数据信息有不同的来源,具有数量、不清洁等诸多不良特点,进而不能直接对这些数据进行使用,也不能直接将这些数据输入到数据仓库中,所以需要对这些数据先进行处理分析,然后再将这些数据以高质量输入到数据仓库中供用户使用。因此,数据仓库的核心技术——ETL技术负责对数据信息进行清洗、转换等,保证数据信息质量的一种技术,ETL技术可以将数据分散、数据不清等问题进行解决,保证数据信息可以高质量的输入到数据仓库中供企业的各部门安全使用。

(二)数据仓库用于科研数据的快速检索、查询

数据仓库是为了实现数据的存储、检索以及表达,例如当数据仓库中的数据需要从一种形式转换成另一种形式时,ETL的数据转换就需要进行考虑,同时ETL中的数据抽取、转换、装载等都需要变成转换操作,所以对于数据仓库而言数据转换是其核心部分。数据仓库实质上是一个独立的数据环境,它需要从不同的系统中抽取所需要的数据,然后通过ETL技术将这些数据进行处理,处理过后的数据信息才可以安全的输入到数据仓库中。ETL技术主要涉及到互连、复制、转换、监控等方面的内容,在数据仓库中的数据不需要和处理系统中、或者其他相关系统中的数据保持同步,尽量保证数据仓库中信息的有效性。

为了将数据冗余等问题进行避免,在抽取的数据进入到数据仓库之前,需要对其进行有效性检查,这项工作在数据仓库数据输入中非常重要,如果没有对这些即将输入到数据仓库的数据进行有效性检查,就会对整个数据仓库的完整性产生破坏,或者将其破坏的几率大大的增加。对数据进行有效性检查最好的方法就是源系统。在源系统中有专业的和非专业的技术知识人员,但是数据有效性检查是一项费时又不可省略的一个环节,所以可以进行自动化的检查。

(三)通过数据仓库实现科研数据的清除及转换

由于数据仓库中的数据来自不同的数据源,这些数据源可能出现不同的平台上,有不同的操作系统,所以这些数据会以不同的形式输入到数据仓库中。如何将这些数据加载,是数据仓库建立中需要考虑的一个问题,在进行数据迁移的过程中,会将数据以一种适合数据仓库的格式转入数据仓库中,这就是数据的格式化,对数据的处理是数据仓库成功建立的关键,所以在数据提取的过程中,对数据进行格式化,从操作中实现数据资源的共享。ETL技术进行的数据有效性检查是对数据进行标准给定的过程,如果数据的给定没有在界定的范围之内,那么它就是需要清除的对象。数据的清除包括了在给定界限范围之外的数据,对这些数据采取一定的纠正措施。

通过数据仓库,实现科研数据的转换,是为了体现这些数据的价值,使其更加有意义,进一步推动科研工作的进程。在数据转换的过程,使用最好的方法保证数据从原始储存器到数据仓库的过程是同步的,将数据转换的重点放在语言的标准化、数据移动、通信等方面,数据的转换除了自动化转换以外,还具有一定的复杂性,所以在ETL数据转换工具、技术不断更新的同时,还需要将其复杂性进行解决。

(四)数据仓库与科研数据动态更新

随着科研进程的推进,数据仓库也需要伴随着科研数据的动态进行更新,这样,才有助于实现数据的时效性。对检查验收之后的业务数据进行相应的更新,其他的数据都是在年底的时候才进行统一的更新。两项或者两项以上的、连续生产经营活动的变化和更新,都会被看作是多次变化,需要分别进行更新。数据仓库更新方法主要是主键关联法,主键关联法就是要求被更新的数据库和更新数据库具有相同标识的小班唯一键值,然后才可以进行一对一的关联,最后才可以进行数据仓库数据的更新,主要更新的手段是字段更新。在对数据仓库进行更新时,必须保证的是一对一的关联,要不然会产生错误的逻辑关系。

(五)数据仓库在科研档案管理中的应用

通过数据仓库来实现科研的档案管理工作,对完善科研档案管理具有重大的意义。对科研课题档案资源进行研究和开发利用,档案管理人员要注意联合课题研究人员一起,及时的对各种课题档案进行整理,通过数据仓库,对档案资源进行整合。然后积极的利用各种信息化技术,有效实现档案资源的共享。并努力的深入研究开发各种档案资源,更好的为经济建设提供服务,最大程度的妥善利用各种档案资源,保证科研究成果的最大化利用。从而有效的实现通过合理的利用促进科研工作的快速发展的目的,取得较大的经济社会价值。

三、结语

针对现阶段我国研究所科研项目管理工作中存在的问题,积极运用数据仓库,来实现对科研数据资源的整合及管理。依靠数据仓库实现科研档案的规范化管理,以科研动态为基础,及时更新数据仓库,保持数据仓库的时效性。数据仓库在科研管理中的应用,进一步优化了我国科研管理工作,提高了科研管理的质量和效率。努力提升我国科研管理能力,完善科研项目管理程序,使该管理体系逐步趋向规范化、成熟化。

参考文献:

[1]焦振.基于Oracle的人事科研数据仓库设计与实现[J].安阳师范学院学报,2013,(2):46-50.

[2]汤雪,赵卫东,吕万里等.高校教职工科研管理系统数据仓库设计[J].福建电脑,2010,26(2):119-119,102.

[3]肖红玉,黄静,陈海等.数据库技术在科研管理系统中的应用[J].制造业自动化,2010,32(10):68-70.

[4]巫莉莉,张波,李涛等.高校科研管理系统智能分析模块的分析与实现[J].计算机工程与设计,2010,31(11):2641-2644.

[5]胡君.基于数据仓库的科研管理系统设计与实现[D].中国地质大学(武汉),2011.

注:

本文为2009年广东医学院科研基金项目(Q2009021)。

猜你喜欢

数据仓库科研管理应用
基于数据仓库的数据倾斜解决方案研究
烟草商业企业科技创新体系建设案例研究
数据仓库系统设计与实现
科研管理者在自然科学基金申报中的服务成效提升策略
GM(1,1)白化微分优化方程预测模型建模过程应用分析
煤矿井下坑道钻机人机工程学应用分析
气体分离提纯应用变压吸附技术的分析
会计与统计的比较研究
数据复用在存储数据仓库中的运用
数据仓库技术在档案管理领域的应用