APP下载

科学数据管理背景下高校IR系统用户行为建模研究

2016-10-27史雅莉

图书馆 2016年10期
关键词:数据管理变量图书馆

史雅莉

(武汉大学信息管理学院 武汉 430072)

·实证研究·

科学数据管理背景下高校IR系统用户行为建模研究

史雅莉

(武汉大学信息管理学院武汉430072)

以技术接受模型理论为基础,构建高校 IR 用户接受模型并对其进行验证。研究发现,感知有用性、感知易用性、使用经验及部分外部变量与用户的IR使用行为呈显著正相关。国内高校IR建设发展过程中应注意以下四方面问题:整合数据资源与提高数据质量、完善IR功能与提高系统运行效率、加大宣传力度与开展教育培训工作、调整图书馆职能与增强数据服务意识。

高校IR技术接受模型用户行为

〔引用本文格式〕史雅莉.科学数据管理背景下高校IR系统用户行为建模研究[J].图书馆,2016(10):53-57

1 引言

随着数据密集型科研趋势的日益明显,无论是学术研究机构,还是图书馆、档案馆等信息服务机构都需对大规模的数据进行管理,确保数据质量[1]。OpenDOAR统计数据显示,截至2016年5月,世界范围内在此网站上注册的机构库(Institutional Repository,IR)数量已达3049个[2]。为适应科研环境的变化,国内由北京大学、清华大学、南京大学等高校牵头的首批14所国家协同创新中心已于2013年4月11日通过认定[3],国内机构库的建设与发展逐渐备受关注。针对高校科学数据管理的CALIS三期IR建设与推广项目于2012年4月通过验收,在IR系统开发、内容建设和制度建设等方面均取得显著成效。该项目根据高校需求规范建立IR数据资源共享平台,协助高校发布、共享和保护现有数字资源,提升各高校科研管理与知识服务水平[4]。学术界,相关学者也对此展开了专题研究[5],但从用户角度对高校IR利用情况的研究相对较少。本研究采用实证方法,通过模型构建对目前我国高校IR用户使用行为进行量化分析,以期为国内高校IR建设与发展提供借鉴与参考。

2 模型构建与研究设计

2.1模型构建及研究假设

笔者通过调研发现,高校IR作为一种科学数据共享平台,以图书馆网站为依托,已在很多高校投入并广泛使用。尽管刘巧英[6]、胡海燕[7]等学者已针对用户从不同角度进行了研究,但目前国内高校科学数据管理尚未形成统一定制,为了更好地完善IR的职能,提高其利用率,使高校科学数据得到最大程度的利用和共享,本研究从用户的角度出发,以Davis、Venkatesh等人提出并通过长期实践检验的技术接受模型为基础,构建了高校IR用户接受模型[8,9](参见图1)。

图1 高校IR系统用户接受模型

高校机构知识库用户接受模型中共有12个变量,其中包括3个核心变量(感知有用性、感知易用性、行为意向),7个外部变量(主观规范、形象、工作相关性、信息质量、计算机自我效能感、感知愉悦性、便利条件),1个调节变量(经验)以及结果变量(使用行为)。据此,本研究提出以下假设,并在参考国内外相关文献的基础上,对理论模型中的各变量指标做出定义和解释(参见表1)。

表1 变量定义及研究假设

2.2研究设计及数据收集

本研究采用问卷调查法对上述各项指标进行测量。问卷设计题型以选择题为主,共分为三个部分。第一部分是对用户高校机构库使用基本情况的调查,包括使用时长、使用频率、浏览方式等。第二部分是问卷主体部分,采用李克特量表对高校IR用户接受模型中各变量的测量,将用户态度分为“非常同意/5分”、“同意/4分”、“不确定/3分”、“不同意/2分”、“非常不同意/1分”五个层次,通过打分制获取定量调查结果。第三部分是对用户基本信息的调查,包括性别、年龄、职业、专业等信息。

在调研过程中以问卷调研为主,正式调研之前进行了专家小组讨论和预测试。调研对象主要为清华大学和北京大学两所高校的师生以及科研工作者,共发放349份调查问卷,其中纸质版调查问卷322份,电子版调查问卷8份,网络版调查问卷19份,共计回收323份,回收率为92.6%。剔除误填、未填完、空白卷、同一答案、选择失真等废卷45份,得到有效问卷278份,有效问卷回收率为86.1%。由于此次调研问卷是分批发放,所以数据转录与问卷发放工作交叉进行,转录及统计分析工具为社会科学统计软件SPSS20.0。

3 数据统计与分析

3.1描述性统计

本次调查样本中,男性有167位,占样本总数的60.1%,女性有111位,占样本总数的39.9%,年龄分布主要集中在40岁以下,本科生、硕士研究生、博士研究生、教研工作者分别占样本总数的37.4%、34.9%、21.9%、5.8%。专业领域涉及社会科学、自然科学、工程学等,其中自然科学和工程学的有效样本所占比例为44.2%,略高于社会科学领域的样本量,有利于均衡样本的学科分布,保证调研数据的有效性。

表2 IR使用经验分布情况

关于用户使用经验,本次调研对象都是高校IR的使用者和潜在使用者,由表2可以看出,大部分受试者都具有一定的IR使用经验。对本校IR有半年以上使用经验的人数占样本总数的68.7%,在频率统计中,计入周使用频次的人数占样本总数的85.3%。其中35%的受试者每周使用IR的累计时长为1-5小时,21.2%的受试者每周使用IR的累计时长在5小时以上。

关于用户浏览习惯的统计,研究通过调研受试者对IR中数据资源的浏览方式,进一步分析高校IR科学数据的分类管理。调查数据显示,91.4%的受试者更愿意通过学科主题的方式浏览和查找所需科学数据,46.0%的受试者更愿意通过作者去浏览,其次是年代(21.6%)和机构(16.2%),最后是载体类型(8.6%)。

关于IR数据资源分布情况,目前高校IR中所包含的数据资源以期刊论文、会议论文居多,对实验数据、年度报告等数据的管理位居其次,对专利、工作文稿、计划或蓝图等数据收集和共享较少。此外,有四位受试者还选择了“其他”选项,提出了视频课程等内容(参见表3)。

表3 IR数据资源分布情况

3.2信效度检验

为保证总样本数据的有效性,本研究在因素抽取和主成分分析后,采取直交转轴最大变异法对每个层面构念的量表进行了效度检验。由表4可知,五个层面的KMO值介于0.725至0.872之间,指标统计量均大于0.700,显著性概率值P=0.000〈0.05,由于KMO值越接近于1,表示整体数据越适合进行因素分析。因此,本研究中每个层面构念的整体数据都比较适合进行因素分析。此外,在反映像相关矩阵中每个变量的取样适当性量数即MSA值越接近于1,因此,每个层面构念的个别题项都比较适合进行因素分析。

表4 各因素组的KMO与Bartlett’s检验

根据信度指标值判断准则,分量表的信度指标值最少要在0.6以上,由表5可见,第五层面构念题项的Cronbach's Alpha值相对偏低,但仍高于0.6,考虑到内部一致性信度的高低会受题项数量的影响,而在本研究中这两个因素所包含的题项均较少,因而该信度检验结果也是可以接受的。

表5 各因素组的可靠性统计量表

3.3回归分析

表6为PU、PEOU、BI、AU四组变量的回归系数及其显著性检验,包括预测变量的非标准化的回归系数、标准化的回归系数、回归系数显著性检验的t值及显著性概率值、共线性诊断的统计量(允差及方差膨胀系数VIF)(见表6)。根据分析结果可知,四组变量的标准化回归方程式:

PU=0.323×IQ+0.197×PEOU+0.085×SN+0.064×I

PEOU=0.323×PE+0.322×CSE+0.175×FC

BI=0.306×SN+0.200×PU+0.086×PEOU

AU=0.513×BI+0.191×FC

从标准化回归方程式中可以看出,PU的四个预测变量中以IQ和PEOU两个自变量对效标变量的影响较大,SN和I变量的对其影响相对较低。由于四个预测变量的标准化回归系数值均为正数,表示其对效标变量的影响均为正向。四个预测变量回归系数显著性检验的t值分别为5.306(P=0.000〈0.05)、3.161(P=0.002〈0.05)、1.320(P=0.188〉0.05)、1.479(P=0.140〉0.05)。因此,回归系数未达显著的预测变量有“主观规范”和“形象”,原因是SN与PEOU、I与SN变量均呈显著正相关且相关程度为中度关系,故被排除于回归模型之外。但是,回归分析中未达显著水平的预测变量SN和I不一定与效标变量没有关系,由积差相关分析可知,其与效标变量PU均达显著相关。

同理可知,PEOU的三个预测变量PE、CSE、FC与其效标变量PEOU均达显著相关。BI的三个预测变量SN、PU、PEOU与其效标变量BI均达显著相关。AU的两个预测变量BI和FC与其效标变量AU达显著相关。但二者的允差值均为0.942,方差膨胀系数均为1.062〈2.000,未大于评定指标值10,表示进入回归方程式的自变量间的多元共线性问题不明显。

表6 模型回归系数摘要

3.4调节变量的效应分析

E是高校IR用户接受模型中的调节变量,研究采用分组多元线性回归方法对E的调节效应进行了分析。在回归分析过程中将调研用户使用经验单选题的题项进行了逻辑划分,把用户使用经验划分为2年以下、2-4年、4年以上三个阶段。据此,构建了回归模型1、2、3并得出分组回归分析结果(参见表7)。

表7 经验调节模型摘要

E调节SN与PU之间的关系,本研究中假设随着E的增长,SN对PU的积极直接影响会削弱(H14)。如表6所示,模型1为2年以下组回归方程,该回归模型的多元相关系数R2=0.145,能够解释因变量PU变异量的14.5%,P=0.000〈0.05,表示模型1的总体回归效果是显著的。模型2为2-4年组回归方程,该回归模型的多元相关系数R2=0.269,能够解释因变量PU变异量的26.9%,P=0.000〈0.05,表示模型2的总体回归效果是显著的。模型3为4年以上组回归方程,该回归模型的多元相关系数R2=0.038,能够解释因变量PU变异量的3.8%,P=0.300〉0.05,表示模型3的总体回归效果未达显著水平。同理,E调解SN与BI之间的关系,本研究中假设随着E的增长,SN对用户BI的积极直接影响削弱(H15)。由下表数据可知模型1、2、3的总体回归效果均达显著水平。

4 结论与建议

4.1假设验证

本研究利用SPSS20.0软件,采用相关分析、多元线性回归分析和分组回归分析对高校IR用户接受模型的假设进行了验证(参见图2)。由验证结果可知,PU的变异量可被解释28.7%,PEOU的变异量可被解释41.5%,BI的变异量可被解释22.4%,AU的变异量可被解释34.7%。各回归模型的整体显著性检验的F均达显著水平(P=0.000〈0.05),除H3、H14外,其他假设均已通过验证。

图2 高校IR用户接受模型验证结果

4.2国内高校IR系统建设的建议

4.2.1整合数据资源与提高数据质量

内容构建是高校科学数据管理及高校IR发展的核心,在调研过程中不少用户反映IR数据资源更新不及时、准确性较差、分类不够清晰、内容不够精炼等。因此,已建或将建的高校IR应把内容建设作为重中之重,拓宽数据资源的学科覆盖范围。另外,由于科学数据的时效性较强,所以IR系统应做好资源更新工作。本次调研数据显示,用户在使用IR进行数据检索时更倾向于通过学科主题和作者的分类方式浏览资源,因此高校馆应充分整合数据资源并对其进行有效分类,保证资源检全率,使之得到最大程度的共享。

4.2.2完善IR功能与提高系统运行效率

完善的系统功能是有效管理科学数据的前提和保障。高校在系统设计时应充分考虑用户需求,在不影响检索效率的前提下,简化操作方式,增强检索结果的可视化效果,使用户界面更加人性化。在系统投入运行后,还应做好系统维护工作,及时发现问题并予以解决,这样不仅可以提高系统反应灵敏度,还可节约用户时间,降低其等待成本。此外,由于大多高校IR系统的运行依托于图书馆网站,所以图书馆系统整体工作效率的提高对于高校IR功能的完善至关重要。

4.2.3加大宣传力度与开展教育培训工作

对于很多用户尤其是较少使用IR的本科学生或者信息需求层次较低的用户来说,很容易将高校IR与图书馆网站上的常用数据库相混淆,而这部分人很有可能成为IR的潜在使用者,今后可能会因之前并不明确IR的功能而放弃使用。为此,高校应做好以下工作:①加大推广及宣传力度,让广大师生及科研工作者尽早形成对高校IR的正确认知,了解其功能,熟悉其资源布局;②加强用户培训,介绍和普及IR的使用方法;③加强对图书馆工作人员在数据监护、数据管理、咨询技巧等方面的培训[10]。图书馆是高校科学数据管理的主体,只有增强馆员的数据管理能力才能保证IR系统的有效运行,促进科研成果的传播与共享。

4.2.4调整图书馆职能与增强数据服务意识

图书馆及其工作者在高校科学数据管理及高校IR应用及推广过程中扮演着十分重要的角色[11]。在数据急剧膨胀、学术交流环境发生巨大变化的社会背景下,作为主要信息服务机构之一的高校图书馆也面临着用户需求不断升级、资源类型多元化、技术革新以及同类搜索引擎的挑战等各方面压力。因此,图书馆在推进IR服务过程中应认真定位自身功能,增强数据服务意识,发挥学术图书馆的功效。与此同时,还需转变传统服务方式,积极嵌入到学科发展过程中,为广大师生及科研工作者提供个性化、嵌入式服务。图书馆还应发挥其资源优势,开展有关IR使用和数据检索的公益讲座,提高用户的信息素养和实际操作水平。

(来稿时间:2016年5月)

1. Gary Marchionini.科研数据管理:保障数据质量,促进Ischools新科学研究[J].图书情报知识,2013(4):4-9

2. OpenDOAR:Proportion of Repositories by Continent Worldwide [EB/OL]. [2016-05-03].http://www.opendoar.org/ onechart.php?cID=&ctID=&rtID=&clID=&lID=&potID=&rSoftWar eName=&search=&groupby=c.cContinent&orderby=Tally%20DES C&charttype=pie&width=600&height=300&caption=Proportion%20 of%20Repositories%20by%20Continent%20-%20Worldwide

3. 2011协同创新中心 [EB/OL]. [2016-04-22].http://baike. so.com/doc/5356440.html

4. 聂华,韦成府,崔海媛.CALIS机构知识库:建设与推广反思与展望[J].中国图书馆学报,2013(3):46-52

5. 燕今伟. 专题: 高校科学数据管理与服务机制及运行平台研究[J].图书情报工作,2013(6):11

6. 刘巧英.基于用户需求的高校机构知识库的功能构建[J].现代情报,2011(11):150-153

7. 胡海燕.以用户需求为导向的高校机构知识库自存储服务机制研究[J].图书情报工作,2013(10):33-37, 32

8. Venkatesh V., Morris M.G.Why Don’t Men Ever Stop to Ask for Directions? Gender, Social Influence, and Their Role in Technology Acceptance and Usage Behavior[J].MIS Quarterly, 2000, 24(l):115-139

9. Viswanath Venkatesh,Fred Davis. A Theoretical Extension of the Technology Acceptance Model: Four Longitudinal Field Studies[J].Management Science, 2000, 46(2):186-204

10. 邢文明,吴方枝,司莉.高校图书馆开展科研数据管理与共享服务调查分析[J].图书馆论坛,2013(6):19-25,61

11. Diana L.H.,Catherine S.Y., Steve K.F..Changing Roles of Reference Librarians:the Case of the HKUST Institutional Repository[J].Reference Services Review,2005, 33(3):268-282

Modeling Study on User Behavior of IR under the Background of Research Data Management

Shi Yali
( Information Management School, Wuhan University )

This paper construct college IR user acceptance model based on technology acceptance model theory,and then through empirical research method to validate. This study found that perception of usability, perceived ease of use, experience and other external variables have a significant positive correlation with user IR usage behavior. Domestic construction and development of IR university should note the following four aspects: integrate data resources and improve the quality of data, strengthen IR function and improve the system efficiency, intensify propaganda and educational training work, adjustment library functions and enhanced data service awareness.

University IRTAMUser behavior

G250

史雅莉(1989-),女,博士研究生,研究方向:科学数据机构库联盟,知识组织。

猜你喜欢

数据管理变量图书馆
企业级BOM数据管理概要
定制化汽车制造的数据管理分析
海洋环境数据管理优化与实践
抓住不变量解题
CTCS-2级报文数据管理需求分析和实现
也谈分离变量
图书馆
分离变量法:常见的通性通法
去图书馆
变中抓“不变量”等7则