APP下载

大数据下图书馆服务的精准用户画像研究

2020-03-23吴睿青

卷宗 2020年2期
关键词:用户行为用户画像图书馆服务

摘 要:大数据时代用户需求日益多元化、个性化,基于用户画像的智能信息服务深刻地改变了人们的生活,对图书馆领域产生了重要影响,研究用户画像对社会的发展具有重要作用。本篇文章通过对用户画像的定义、数据特征及来源、图书馆用户画像的构建方法以及图书馆服务的完善路径等方面展开介绍,旨在突出强调大数据下图书馆服务的精准用户画像研究的重要性。

关键词:用户画像;图书馆服务;用户行为

1 引言

近年来,基于用户画像的智能信息服务在众多领域得到了广泛应用,图书馆也逐渐融入到了用户画像的发展浪潮中,用户画像方法近年来不断被应用于营销服务研究领域中,成为精准描述用户行为特征的有利工具之一。它可以准确描述差异化的用户群体特征,通过画像建模呈现特定业务情境下每个差异群体的用户类型、心理使用偏好和使用习惯,从而驱动以用户需求为导向的服务创新与发展。

2 用户画像概述

1)用户画像的概念。用户画像又称用户角色,作为一种勾画目标用户、联系用户诉求与设计方向的有效工具,用户画像在各领域得到了广泛的应用。一個persona(Persona是用户模型的简称)可以比任何一个真实的个体都更有代表性。一个代表典型用户的persona的资料有性别、年纪、收入、地域、情感、所有浏览过的URL、以及这些URL包含的内容、关键词等。

2)构建用户画像的方法。关于构建用户画像的方法很多,比较典型的是Alen Cooper的“七步人物角色法”,包括界定用户行为变量、将访谈主题映射至行为变量、界定重要的行为模式、综合特征和相关目标、检查完整性、展开叙述、制定任务角色模型七个步骤。Lene Nielsen的“十步人物角色法”,包括发现用户、建立假设、调研、发现共同模式、构造虚构角色、定义场景目标、复核与买进、知识的散布、创建剧情和持续的发展十个步骤。

2)用户画像的数据特征。用户画像是基于海量数据建立起来的标签式虚拟用户,针对其数据来源不同的学者有不同的看法,例如学者姜建武等人认为:笼统地看,用户画像的数据来源大概包括两种类型:静态的用户基本数据(年龄、体重等)和动态的时间、地点、行为等数据(也称为静态信息本体和动态信息本体),同时动态信息本体隐藏在用户行为之中,需要利用互联网技术进行捕捉。也就是将用户画像的数据来源概括为静态的基本数据和动态的行为数据。

3 大数据下图书馆用户画像的构建方法

数字图书馆绘制用户画像是转变服务视角,从用户角度进行战略规划,以全方位用户数据采集、挖掘与分析,以保障图书馆资源、服务环境与用户需求匹配。

1)精准识别目标群体,作出假设。首先,要明确用户群体,数字图书馆登录系统的注册信息,是识别、区分用户群体的良好方法。数字图书馆也需要采集用户不同情境下的动态行为数据,从媒体、场景、路径等多个维度,识别用户在不同状态下的访问轨迹。其次,做出用户角色假设,在用户角色分析之前,要有个对用户划分的方向。任何一个用户群体都有多种分类方式,首先要确定怎样来分类客户,确定分类方式之后,再具体一个一个分类来研究。

2)收集数据。对于用户的研究,一般从定性和定量两方面进行。定性研究的方法主要包括用户访谈、现场调查和可用性测试等。用户访谈是在创建人物角色时最常采用的方法,最好是非正式、松散的谈话,访谈主题是用户的目标、观点和行为。现场调查,也称为情境调查,是观察人们在自然状态下的行为,得到的更多的是关于人们在使用网站时的上下文环境信息,比如地点、时间、方式和原因。可用性测试是一种观察用户行为的经典的定性研究技术。

定量研究能更高的决定工作的重要性和优先级,一般采用问卷调查和数据分析相结合的方式来研究。问卷调查相对于其他方法而言,更容易收集到用户的目标、行为、观点和人口统计特征的量化数据,是定量研究的第一选择。但要注意的是,问卷调查得到的是自我评价的数据,是用户自己想要告诉的关于他们自己的事,并不完全是他们的实际行为。基于这个原因,在有可能的情况下,用数据分析网站流量统计来补足问卷调查数据是一个明智的选择。

3)用户画像构建。在构建用户画像模型过程中,涉及复杂的计算方法,主要依靠机器学习来完成。例如,数字图书馆需要对收集而来的用户数据进行底层规整处理,将纷乱复杂无序的大数据转化为维度相同的向量,便于后续的机器计算。再对整理好的数据进行相似、相反的类别划分,聚类的算法为图书情报常用的计算方法k-means,除此之外,数字图书馆对用户画像建构的计算方法还包相似度计算、预测算法、语言处理数据关联统计算法等。

4 基于精准用户画像的图书馆服务完善路径

1)关注用户画像与资源模型的匹配度,完善馆藏资源建设。数字图书馆需要将用户画像与馆藏的信息资源进行匹配,首先,要对用户画像进行数据描述,即标签处理;其次,要对馆藏资源进行同样的数据处理,抽取特征标识和语义相关资源信息;最后,将两个数据集进行交互匹配,若匹配成功,则生成群的相似集,数字图书馆通过用户画像建立起来的标签则可映射到主题中,与相似集进行进一步的匹配。在此基础上,数字图书馆可精准分析用户的阅读偏好,进而为用户构建特色数据库,加强资源建设力度,提高数字图书馆的核心竞争力。

2)挖掘隐性语义模型。数字图书馆在收集数据源时,要注重突破原有的数据库资源模型限制(原有的数据库资源局限于用户的基本信息和内容偏好数据,忽视用户阅读行为所产生的浏览痕迹,即隐性语义),采用隐性语义进行资源的推荐,形成“用户标签——隐性语义模型——内容标签”的流程,这个模型的优势在于能够充分挖掘隐性语义,从而使数字图书馆能够进行精准的信息推送服务。

3)监控动态知识流动轨迹。基于用户画像的数字图书馆信息服务,能够形成多种数据规律的揭示手段,例如,数字图书馆可以构建信息资源的关系流动网络图谱,形成面向不同用户的推理图谱,图谱间具有明显的差异特征和推理特征,可以追踪到不同时间、空间下的多维度阅读轨迹。通过这种动态的用户画像构建过程,可以为数字图书馆信息服务提供实时的演化过程以供参考,使得数字图书馆的信息服务是不断以用户为中心的,随着用户需求的变化而不断完善的。

5 结语

知识服务是图书馆重要工作内容,虽然近年来人们对图书馆发展与用户画像的融合进行了研究,但与其他行业部门相比,无论是图书馆学与用户画像的基础理论及图书馆实践应用都相对落后。用户画像是大数据时代精准服务的重要工具,图书馆拥有巨量的读者用户群和庞大的数据,引入用户画像可以促使图书馆真正了解用户,为用户提供全方位、人性化、个性化的定向优质服务,我国图书馆界应重新审视服务系统以更开放的视角,进一步深入开展用户画像的理论研究与实践探索。

参考文献

[1]穆德,亚尔.赢在用户:Web人物角色创建和应用实践指南[M].范晓燕译.北京:机械工业出版社,2007.

[2]赵岩.基于用户画像的数字图书馆智慧阅读推荐系统研究[J].图书馆学刊,2018,40(07):121-124.

[3]薛欢雪.高校图书馆学科服务用户画像创建过程[J].图书馆学研究,2018(13):67-71,82.

[4]陈添源.高校移动图书馆用户画像构建实证[J].图书情报工作,2018,62(07):38-46.

作者简介

吴睿青(1996-),女,汉族,山西省运城市,硕士研究生,上海大学,研究方向:图书馆。

猜你喜欢

用户行为用户画像图书馆服务
电力高校图书馆转型智库服务的研究
社会化媒体用户使用动机与行为探析
浅谈工匠精神在高校图书馆服务中的传承
浅谈阅读推广活动的探索与实践