APP下载

杰出人才精准画像构建研究
——以智能制造领域为例*

2019-06-18池雪花章成志

图书馆论坛 2019年6期
关键词:杰出人才画像专利

高 扬,池雪花,章成志,孔 捷

0 引言

近年全国各地对杰出人才的需求旺盛,政府、企业和高校等用人单位急需一套科学合理的杰出人才识别、遴选和评价方法。科学的人才识别和评价机制有助于发挥引才工作的前瞻性和引导性,从而掌握杰出人才竞争的主动权。目前中央和地方层面已基本形成覆盖多学科,多层次,旨在识别、遴选和评价杰出人才的高层次人才项目资助体系。虽然这些高层次人才项目已经获得了海内外各界的认可,但仍存在着人才分类评价不足、评价标准单一、评价手段趋同、评价社会化程度不高、评价结果不够精准等问题,未能充分满足我国各行各业精准识别和评价杰出人才的需求。根据2017年江苏人才发展战略研究院对全球智能制造人才分布的调研显示,我国智能机器人、高档数控机床和3D打印三大领域具有国家级或省市级人才项目头衔的杰出人才占杰出人才总量不到三分之一。这表明有大量的智能制造杰出人才未被识别,现有的人才项目对杰出人才的识别和评价效果有待提升。因此,对特定领域杰出人才进行识别和评价,并发现杰出人才特征和人才现状显得尤为必要,有助于为特定领域的人才引育工作提供参考。

随着大数据产业的发展,海量数据加速集聚,人们在互联网上留下大量“踪迹”。为了准确描绘互联网用户的特征,用户画像技术的应用日渐广泛。基于杰出人才在互联网上留下的“成长轨迹”,可将用户画像技术应用到人才研究领域构建人才画像。本文精准构建杰出人才画像,揭示特定专业领域的杰出人才群体特征,为人才管理部门的引才工作进行定制化服务和个性化推荐,为实现数据驱动的人才管理模式提供支撑。本文具体研究思路如下:首先通过各种途径获取人才“轨迹”数据,构建初始人才库;然后利用专家评价法识别杰出人才,构建杰出人才库;接着从多个维度构建杰出人才画像;最后通过统计分析揭示杰出人才的群体特征。

1 相关研究概述

与本文相关的研究主要包括人才识别与评价、用户画像两个方面,下面分别对这两个方面的研究现状进行概述。

1.1 人才识别和评价研究概述

情报学中对人才的识别和评价主要基于文献计量学。贺德方利用知识管理思想构建了科技人才评价体系[1];金碧辉解读了评价科学家个人绩效的h 指数[2];邱均平等运用Hirsch 指数对CSSCI 收录的被引次数排名前50 位图情学者的个人研究绩效进行分析[3];张学梅以我国图情领域100 名作者为例,比较NSP 与H 指数的异同以及适用范围[4];马妍等探讨H 指数与类H 指数应用于人才遴选的可行性[5];隋桂玲以实证分析比较g 指数与h 指数、e 指数在评价科技工作者学术水平时的适用性[6]。情报学已有的人才识别方法存在评价标准单一问题。人力资源管理常用的人才识别方法有导师推荐、专家评估法、同行评价和实践检验,这些方法在人才评价中被广泛使用,其中德尔菲法是国际通用的人力资源管理方法,具有广泛的代表性,较为可靠。这些人才识别和评价工作为本文研究奠定了基础。

1.2 用户画像研究概述

用户画像构建旨在根据用户的行为、观点、目标等差异,抽取出高度精炼的用户特征标识,如兴趣爱好、心理特征。用户画像构建维度一般包括用户基本属性、用户兴趣以及结合具体应用场景下的属性。用户的基本属性包括一些基础注册信息和背景信息等人口统计学特征,如年龄、性别、职业、地区、性格。兴趣特征主要是通过对用户的历史行为数据进行挖掘得到。Hung 等利用用户的标签和收藏的书签,从个人角度构建用户兴趣模型,然后结合好友数据扩展用户兴趣特征项,从社会角度发现用户兴趣[7]。在不同应用领域,用户画像属性有所差别。在社交领域,Macskassy 针对用户的转帖行为以及微博内容生成用户兴趣画像[8]。在通讯领域,张慷基于用户基础信息、终端信息、业务订购等信息,形成手机用户画像[9]。在消费领域,高玉龙从行为属性和价值属性构建网购用户画像,行为属性包括品牌偏好、产品偏好、购买动机等,价值属性包括购买频率、平均每次交易额、社交偏好等[10]。在金融领域,主要从人口属性、消费属性、信用属性等构建用户画像[11]。

随着技术飞速发展,用户画像逐渐被电子商务、金融保险、社交媒体等多个领域所应用。目前将用户画像技术应用在人才领域,以人才为对象,进行人才特征标识从而构建人才画像的研究尚不多见,对人才画像的定义尚未成形成共识,大多是面向实践工作的具有操作性的界定。本文借鉴用户画像方法,依据专业领域需求,从多个维度构建杰出人才画像,揭示杰出人才的群体特征。

2 研究思路

图1 特定专业领域的杰出人才精准画像构建研究思路

本文认为杰出人才是对具备杰出能力的人才的总称,至少包含两层意思:一是杰出人才必须术业有专攻;二是杰出人才必须具备成为一个团队的核心和灵魂的能力。据此,可将杰出人才界定为已取得同行公认的创新性成绩或创造性科技成果,具有发展潜力,能引领和带动产业科技发展并处于领先地位的团队带头人。本文的杰出人才画像构建研究包括四部分:第一,采集并预处理人才留下的大量“轨迹”数据,如学术论文、发明专利、科研项目、获取奖项等基础信息,构造初始人才库;第二,邀请专家从初始人才库识别出杰出人才,由此构造杰出人才库;第三,从多维度构建杰出人才画像;第四,通过统计分析发现杰出人才的群体特征。

2.1 初始人才库构建

本文在具体的人才信息搜索中,对人才操作化的定义是与千人计划、万人计划、国家杰出青年科学基金入选者同等水平的人才。由于目前还没有公开的具有权威性的人才排行榜,因此本文主要通过两种途径获取全面且具有权威性的人才轨迹数据信息。一是专家推荐。专家团队由相关领域的著名高校学者、知名科研院所研究人员以及知名企业高管层组成。专家团队提供搜索杰出人才信息的线索以及部分杰出人才信息。二是线上资源检索,从人才信息分布平台获取数据,如学术平台、专利信息平台。学术平台如科研在线(http://www.escience.cn/)提供了大量学术主页信息,包含基础信息和学术成果等信息。专利信息平台如IncoPat 数据平台(http://www.incopat.com/)收录了112 个国家/组织/地区的1 亿余件专利信息。基于以上信息源,采用信息抽取技术获取人才的基本数据,包括基础信息和研究信息两部分。基本信息包括人才的性别、年龄、出生日期、国别、省、市、所在机构、职称、职务、头衔、电子邮箱、联系电话、通讯地址等;研究信息如专利拥有量、专利内容、研究方向、人才URL、成果信息(如获奖情况)等。这两部分共同构成初始人才库。

2.2 杰出人才识别

如何从大量的人才集合中识别杰出人才是本文的研究重点之一。根据杰出人才的定义,本文要识别的杰出人才需具备引领和带动产业科技发展的潜力,单纯依据文献计量法无法找到与产业相关的技术人才,因此,本文基于德尔菲法[12]识别杰出人才,即:就一定的问题函请相关领域的专家提出意见或看法,然后将专家意见或新设想加以科学地综合、整理、归纳,以匿名的方式将所归纳的结果反馈给各专家再次征询意见。如此经过多轮反复,直到意见趋于集中,得到一种比较一致的、可靠性较高的意见。该方法具有一定的科学性和实用性。具体步骤:(1)确定被遴选的对象:从初始人才库中挑选出杰出人才集合;(2)选择该领域相关专家;(3)向各位选定专家发出杰出人才遴选调查表;(4)对返回的调查表进行定量统计分析并将结果反馈给专家;(5)专家重新给出人才遴选结果;(6)重复(4)(5)两步直到取得大体上一致的意见。

2.3 杰出人才画像构建

本文借鉴用户画像的构建方法,对识别出的杰出人才进行画像构建。由于人才数据具有高度的隐私性,较难获得,因此难以构建“完整”的用户模型。本研究结合实际的应用场景,针对特定专业领域的杰出人才特征以及人才管理工作的实际需求,科学设计杰出人才画像标签体系,对特定专业领域的杰出人才进行精准画像构建。

2.4 杰出人才群体特征分析

相较于杰出人才的个体画像,杰出人才群体特征呈现的是符合某一标准的杰出人才群体特征。不同阶段的杰出人才在学术影响力方面的特征比较统一,这就更有利于本文从杰出人才的年龄、性别、研究方向、专利数量、所在机构类别以及地域等方面进行群体特征分析。如果单一地从杰出人才的某个属性方面进行分析会存在一定的局限性,得出的结果也会过于简单,很难形成一定的杰出人才群体特征和规律。

3 智能制造领域杰出人才画像实验

本文基于智能制造领域这一特定场景,精准构建智能制造领域杰出人才画像,具体包括智能制造领域初始人才库构建、智能制造领域杰出人才识别、智能制造领域杰出人才画像呈现三部分。

3.1 智能制造领域杰出人才画像构建

3.1.1 智能制造领域初始人才库构建

以智能制造领域的智能机器人、高档数控机床和增材制造三个子领域为研究对象,构建初始人才库的过程如下:

(1)选取智能制造领域的专家。根据不同的子领域,组建智能机器人、高档数控机床和增材制造3 个专家组。每个专家组由该领域的国内知名学者和产业界知名管理者组成,共10 人,包括有2 名全球500 强公司的高管、2 名具有“院士”“千人计划”等人才称号的专家、2 名一流大学和科研机构的教授、2 名相关行业协会主席、2名人才和产业部门管理者,确保对该领域的人才和机构信息具有全面了解。

(2)请专家提供该领域相关信息。相关信息包括:一是领域人才集聚机构清单;二是领域人才科研产出和专利成果的检索关键词列表;三是领域人才信息。

(3)根据专家提供的领域人才聚集机构清单搜索到人才127 名,按照专家提供的关键词检索出高专利拥有量的发明人共1420 名,同时专家根据领域人才聚集机构清单以及查找专利提供该领域人才2100 名。经过重名比对,最终得到三个子领域人才总计3461 名。

(4)根据3461 名人才清单,通过爬虫技术从数据平台包括科研在线、incoPat 数据平台等补充初始人才相关基础数据,具体包含字段见表1。

表1 人才基础数据

3.1.2 智能制造领域杰出人才识别

使用德尔菲法进行杰出人才识别,通过四轮专家征询,最终得到智能制造杰出人才清单及相关信息。

(1)第一轮征询:邀请专家依据人才研究方向和专利内容,筛选智能机器人、高档数控机床和增材制造三个子领域的潜在杰出人才。

①明确征询问题。请专家去除与三个子领域无关的人才信息,圈选该领域的潜在杰出人才信息,标注无法确认的潜在杰出人才信息。

②选取和确定专家小组。此次每个子领域的专家小组成员扩充至20 人。其中,具有“院士”“千人计划”等人才头衔的专家、全国一流大学相关领域教授、全国知名企业的技术管理人员、全国行业协会的管理人员各5 人。他们具有广泛掌握杰出人才信息的优势。

③将第一份征询调查表发放至专家小组。将包含3461 条领域人才信息的征询调查表发至三个子领域的每位专家,并向专家说明征询问题和工作规则。

④收回征询调查表并进行分析。专家通过查找人才研究方向的关键词以及专利内容中的关键词,去除无关信息1920 条,圈定潜在杰出人才信息1500 条,标注无法确认的潜在杰出人才信息21 条,增补潜在杰出人才信息20 条。

⑤潜在杰出人才信息整理。将专家认为无关的人才信息删除,将专家圈选出的潜在杰出人才信息保留,对专家不确定的潜在人才信息作进一步扩充。将专家认为需要增补的人才信息补充完整。此阶段得到智能机器人、高档数控机床和增材制造三个子领域潜在杰出人才信息共1541 条。

(2)第二轮征询:邀请专家依据人才的职称、所在单位、头衔、获奖情况、专利拥有量等筛选符合杰出人才标准的人才信息。

①明确征询问题。请专家根据三个子领域杰出人才的标准,去除不符合标准的杰出人才信息,圈定符合标准的杰出人才信息,标注出无法确定的杰出人才信息。

②选取和确定专家小组人员。此次每个子领域的专家小组成员扩充至25 人,增加了人才和产业主管部门的管理者5 人。他们对杰出人才的认定具有权威性。

③将第二份征询调查表散发至专家小组。将包含1541 条潜在杰出人才信息表发至三个子领域的每位专家,并向专家说明征询问题和工作规则。

④收回征询调查表,按照专家组意见整理杰出人才信息。将专家认为无关的人才信息删除,将专家圈选出的潜在杰出人才信息保留,对专家不确定的潜在人才信息进一步扩充。将专家认为需要增补的人才信息补充完整。此阶段得到智能机器人、高档数控机床和增材制造三个子领域潜在杰出人才信息共1201 条。

(3)第三轮征询:专家组所有人员对杰出人才标准达成基本共识,精准锁定杰出人才。

向各位专家提供有关集体意见情况和其他专家成员的各自观点,专家组就杰出人才标准达成基本共识。专家一致认为可以将智能制造杰出人才的标准设定为同时具备以下条件的人才:职称在副教授(或其他同等水平)及以上、获得省级以上人才奖励、人才所在单位在本领域业绩排行前10 位。根据专家组达成的共识,精准锁定杰出人才,形成最终意见。本文最终确定了785 条杰出人才信息,其中,智能机器人领域306 条,高档数控336 条,增材制造143 条。表2 是得到的三个子领域的杰出人才信息数量分布。

表2 智能制造三个子领域杰出人才信息

(4)第四轮征询:邀请已有具有人才头衔的专家对杰出人才筛选结果进行评估。

选取智能制造三大子领域的“院士”“千人计划”“万人计划”人才专家各2 名,“长江学者”、国家杰出青年科学基金获得者2 名,组成10 人专家组,对潜在杰出人才的筛选结果进行评估。专家一致认为,筛选出的杰出人才均已取得同行公认的创新性成绩或创造性科技成果,具备引领和带动产业科技发展的潜力。785 名杰出人才水平大体相当,筛选结果比较可靠。

3.1.3 智能制造杰出人才画像模型构建

根据智能制造杰出人才的特征以及人才管理工作的实际需求,从基本属性、研究兴趣、学术影响力三个维度构建杰出人才画像标签体系,清晰完整地呈现智能制造三个子领域的杰出人才信息(具体见图2)。基础属性指相对稳定和静态的人口属性;研究兴趣指的是杰出人才的研究方向;学术影响力则通过杰出人才的H 指数、论文数量、专利数量等来体现。

图2 智能制造杰出人才画像

画像结果能精准清晰地展现智能制造杰出人才的特点。例如,学术影响力较高的杰出人才将是智能制造基础研究的领军人物,肩负着关键核心技术的突破;处在中青年阶段且学术影响力高的杰出人才将成为引领和带动产业科技发展处于领先地位的团队带头人;已形成老、中、青年龄梯度的杰出人才团队更能够支撑智能制造领域的可持续发展。根据以上杰出人才画像,人才管理部门可以对智能制造杰出人才群体的研究方向、发展潜力以及地理坐标等有一个宏观的把握,为人才引进工作以及产业布局提供科学参考。

3.2 智能制造领域杰出人才画像特征分析

3.2.1 杰出人才年龄分布特征

大部分智能制造领域杰出人才的年龄分布在49~58 岁。其中,84%智能机器人杰出人才年龄分布在39~58 岁,81%高档数控机床杰出人才年龄分布在49~68 岁,70%增材制造杰出人才年龄分布在39~58 岁。从三个子领域的杰出人才年龄构成看,增材制造领域杰出人才形成了老中青的年龄梯队,智能机器人领域需要补充29~38 岁的青年杰出人才,高档数控机床领域的杰出人才急需补充29~48 岁的中青年杰出人才。

图3 智能制造杰出人才年龄分布

3.2.2 杰出人才所在机构分布特征

本文将杰出人才所在机构类别分为三种:高校及研究院所、企业和学会/行业协会。如图4所示,从外至内圈,①代表智能机器人领域,②代表高档数控机床领域,③代表增材制造领域。三个子领域中的杰出人才以学术研究型人才居多,集中分布在高校及研究院所,部分分布在企业,只有极少数的杰出人才来自于学会/行业协会。

图4 智能制造杰出人才机构分布

3.2.3 杰出人才性别分布特征

经过数据清洗,得到包含性别信息的智能制造领域杰出人才共726 名。其中,以男性为主,占96%;而女性仅占4%,见图5。

图5 智能制造杰出人才性别分布

3.2.4 杰出人才专利数量分布特征

智能制造领域的杰出人才人均专利数为27项。三个子领域的杰出人才专利数量差别较大,见图6。在智能机器人领域,杰出人才专利数量较为平均且数目较多,皆在20 项专利以上;在高档数控机床领域,高校或研究院所杰出人才人均专利43.78 项,而企业和学会/行业协会的杰出人才人均专利数量较少;相对于其他两个子领域,增材制造领域的杰出人才人均专利数量偏少。

图6 智能制造杰出人才专利数量分布

3.2.5 杰出人才地理分布特征

表3-5 是智能机器人、高档数控机床、增材制造三个子领域的杰出人才在不同省份的人才数量分布情况。从表中看出,智能制造杰出人才集中在北京、辽宁、上海、江苏。其中,智能机器人领域杰出人才主要分布在东部沿海地区和东北地区;高档数控机床领域和增材制造领域的杰出人才分布较为相似,除了集中在东部沿海地区和东北地区,还有一部分分布在西部地区如四川、陕西和重庆。

表3 智能机器人杰出人才地区分布

表4 高档数控机床杰出人才地区分布

表5 增材制造杰出人才地区分布

4 结论与展望

本文将用户画像技术应用于人才画像研究,以智能制造领域为例,开展特定专业领域的杰出人才精准画像构建研究,为我国智能制造杰出人才的引育工作提供参考。本文首先获取智能制造领域人才“轨迹”数据,构建初始人才库;然后利用专家评价法识别杰出人才,从多个维度构建智能制造杰出人才画像;最后分析智能制造杰出人才的群体特征。研究结论如下:总体来看,我国智能制造杰出人才以男性为主(占96%),年龄主要分布在49~58 岁,以学术研究型人才居多,集中在高校及研究院所,人均专利数量27 项,主要分布在北京、辽宁、上海、江苏、湖北等省份。从三个子领域来看,为更好地引领和支撑我国智能制造产业发展,智能机器人领域需要补充29~38 岁的青年杰出人才,高档数控机床领域需要补充29~48 岁、能够带动产业发展的中青年杰出人才,增材制造领域缺乏掌握专利技术的杰出人才。此方法独立于具体领域,可以用于其他领域的人才画像构建。

本文的创新之处:首次将用户画像技术应用于人才画像研究,清晰直观地展示了智能制造杰出人才的群体特征。本文构建的杰出人才画像思路具有可迁移性,可以应用于其他领域的杰出人才画像构建。不足之处:一是杰出人才画像构建的实证研究仅局限在智能制造领域,应用范围有待进一步扩展;二是采用专家评价法识别杰出人才,需耗费大量时间和人力成本,无法大批量进行。下一步将对杰出人才的学术影响力和工作影响力进行更深入的研究。具体而言,将更深入地进行专利内容分析,同时利用一些文献计量学的指标完善杰出人才的学术影响力评估。将选取人才奖励和人才头衔等指标对杰出人才的工作影响力进行评估,更加系统、深入地呈现智能制造杰出人才画像。

猜你喜欢

杰出人才画像专利
专利
威猛的画像
对我国杰出人才培养的一些思考
戏曲表演杰出人才培养若干问题思考
“00后”画像
画像
王妙、周影影入选陕西省高校第三批“青年杰出人才支持计划”
专利文摘
探寻杰出人才的成长足迹——记北京师大附中钱学森纪念馆
潜行与画像