APP下载

全球人工智能专利合作格局演化研究

2022-12-22虞舒文周立军瞿羽扬

科学与管理 2022年6期
关键词:子群专利权人专利

虞舒文, 周立军, 杨 静, 瞿羽扬

(中国计量大学 经济与管理学院, 浙江 杭州 310018)

0 引言

1956 年夏季, “人工智能 (Artificial Intelligence,AI) ” 一词在达特茅斯会议上被首次提出, 标志着“人工智能” 这门新兴学科的正式诞生。 1997 年国际商用机器公司 (IBM) 的 “DEEP BLUE” 计算机打败了人类世界国际象棋冠军, 在人工智能技术发展进程中具有里程碑的意义。 如今人工智能已成为全球科学技术创新的重点关注对象, 美国、 德国、 日本等国家先后推出了人工智能国家创新计划[1]。 中国也在2017年印发 《新一代人工智能发展规划》, 提出中国人工智能产业是 “新的重要经济增长点”, 分三步达到世界领先水平; 2020 年科技部印发 《关于科技创新支撑复工复产和经济平稳运行的若干措施》, 重点举措“培育壮大新产业新业态新模式” 中明确提出要大力推动关键核心技术攻关, 人工智能便是其中重要的一项; 在2021 年发布的 “十四五” 规划中, 人工智能作为战略性重点创新领域被提及6 次。

作为创新成果的表现形式, 专利可以有效反映出国家创新能力。 随着市场经济的激烈竞争, 知识产权保护及合作交流的意识不断提高, 协作研发并联合申请专利日益受到重视, 合作关系在技术扩散、 资源共享、 信息交流、 知识传播等方面都具有重要意义[2]。专利合作网络是两个及两个以上专利权人之间通过共同申请的方式形成的复杂网络, 是一种典型的社会关系网络。 社会网络分析将网络中每个专利权人视为一个节点, 进而研究多个节点之间的交互作用并测度整体网络, 这相比统计分析方法能更有效地挖掘合作网络中的复杂信息。

因此, 在对德温特创新索引数据库中人工智能领域专利进行数据清洗与去重的基础上, 分阶段构建专利合作网络模型, 从整体的网络结构指标、 局部的块模型、 个体的中心度多角度直观剖析各阶段演化特征,以揭示人工智能领域的创新发展规律, 有助于推动该产业的发展, 提升产业整体经济效益, 建立科学的、适宜的人工智能产业发展战略。

1 文献综述

近年来, 国内外关于人工智能专利分析的研究刚刚起步。 赵程程[3]通过绘制全球人工智能技术创新网络图谱, 发现人工智能领域的创新主体中中国企业及机构非常活跃, 其中最具潜力的创新主体包括华为等10 家企业和中山大学等15 家高校及科研院所, 重要创新主体包括腾讯等10 家企业和电子科技大学等10家科研机构; 另外还发现其创新合作具有中美领导全球人工智能技术创新、 中国以 “企业+高校” 主导应用场景设计、 美国以企业主导研发硬件设备等特征。Hidemichi Fujii 等[4]研究发现技术发明的重点已经从生物和理论知识模型转移到特定的数学模型及其他人工智能技术中, 并且人工智能技术专利发布的特点因公司和国家而异。 曾闻等[5]建立了产业领域专利申请状况分布与演化的研究框架, 以人工智能领域为例进行的实证分析发现目前主要专利申请人以美国、 日本的企业为主, 重要关注领域以电数字数据处理技术为主。当前国内外人工智能技术创新研究方法主要包括Citespace、 分解框架、 数据挖掘等。

作为西方社会学的一个重要分支, 社会网络理论始于20 世纪30 年代。 德国社会学家G.Simmel 首次使用了 “网络” 这一概念, 英国人类学家 Radcliffe Brown 则首次提出了 “社会网络” 的概念。 从20 世纪30 年代至60 年代, 越来越多的学者提出和探讨了各种网络概念, “社会网络” 一词渐入学术殿堂。 社会网络分析 (Social Network Analysis, SNA) 运用关系数据来描述网络社会化过程, 构成元素包括节点和边,其中每个节点代表一个行动者, 边代表行动者之间的关系, 因此社会网络可以看作是由作为节点的社会行动者及行动者之间的关系构成的集合。 通过对复杂网络中节点紧密联系程度进行定量分析, 可以从宏观上显示整个网络系统的格局, 也可以反映单个节点在整体网络中的位置。 杨勇等[6]构建出中国发明专利的合作网络并测量出其各项结构特征指标, 通过分析发现专利合作网络规模正在迅速扩大, 其连通性不断增强,而在网络中占据核心位置的是高等院校和大型国有企业。 关鹏等[7]通过各个特征指标发现专利合作网络结构逐渐从碎片化的零散网络向多中心的小世界网络转变, 网络机制中存在 “富者恒富” 的现象, 但核心地区存在发展不平衡的问题。 社会网络分析经过长时间不断地改进与发展, 已经成为一种常用的研究范式并得到推广与应用, 为网络发展提供了科学的研究基础[8]。

块模型最早是由White、 Boorman 和Breiger 于1976年在社会结构研究中提出, 是社会网络分析中一种研究网络位置模型的方法[9]。 该方法根据节点结构相似性将网络中数量庞大的行动者分为数量较少的若干子群, 子群内部成员紧密相连, 子群之间关联程度较弱,从而概括整个网络, 树形图可以表示各子群的所有成员及其内部结构, 因此其本质是把复杂的网络简单化。通过挖掘各子群关注的信息可以提高信息传递的准确性和有效性, 有助于各专利权人准确找到合适的合作伙伴[10]。 块模型近年来也被中国学者采用, 以 “社会网络分析块模型” 为主题词在中国知网文献库搜索,获得相关期刊论文共21 篇, 研究涉及碳排放及转移空间[11-12]、 CSSCI 学术期刊论文数据[13-14]、 突发公共卫生事件应急预案[15]等方面, 而目前将块模型应用于人工智能领域专利合作网络的研究尚不多见。

2 研究设计

首先从德温特创新索引数据库中获取全球人工智能领域专利, 在进行数据清洗及去重后通过Logistic 模型划分出人工智能技术生命周期的三个阶段; 其次,运用社会网络分析得到人工智能三阶段的专利合作网络, 并从整体视角分析三阶段网络结构特征演化、 从局部视角分析三阶段块模型演化、 从个体视角分析三阶段专利权人演化; 最后, 针对人工智能发展提出建议。 研究思路如图1 所示。

图1 研究思路

2.1 数据选择与获取

所用数据来源于德温特创新索引数据库(Derwent Innovations Index, DII), 采 用 “ TS =Artificial Intelligence OR AI” 作为检索式, 检索时间跨度设定为1963—2020 年, 检索日期为2020 年12月16 日, 共检索到29 547 条专利数据。 由于专利申请与公开之间通常有18 个月的滞后期, 因此2019 年之后的数据仅作参考。

检索结果显示, 数据库中有很多专利是以子公司名称申请的, 所以存在同一专利权人对应多个名称的情况。 为了使专利权人的名称标准化, 本文鉴于合作网络分析特性, 将德温特专利数据库中的专利权人代码视为筛选专利权人的唯一标识[16], 若某条专利中出现多个相同的专利权人代码, 则只保留两个且以数字进行编号。

对获得的人工智能领域所有专利数据进行分析筛选, 如果某个专利具有两个或两个以上的专利权人, 则认为其专利权人之间存在合作关系, 据此筛选出具有合作关系的专利数据共4 975 项, 以此作为本文的实证研究对象。

2.2 基于Logistic 模型的人工智能技术生命周期

技术生命周期阶段划分的方法主要包括以具体年份数间隔[17-18]、 专利合作量及申请总量占比变化情况[19]、 技术成熟度曲线[20-21]等, 这些方法均是依据数据或技术本身做出的直观判断。 Logistic 模型最早是由Verhulst 于1838 年提出的, 此后许多学者通过对模型的参数估计、 估计可接受性、 假设检验和预测进行研究, 并结合Logistic 模型的增长规律,拟合分析出某一领域的技术生命周期[22]。 如彭俊杰等[23]运用Logistic 模型预测出印楝农药的专利技术生命周期, 葛亮[24]结合技术生命周期理论和Logistic 模型分析出中国石墨烯制备技术的发展阶段。

由于本文专利合作数据时间跨度较大且数量较多, 因此选择Logistic 模型来分析人工智能的技术生命周期特征, 并使用Logletlab4 软件进行拟合。 技术生命周期的发展阶段一般可以划分为初始阶段 (0%至1%)、 萌芽阶段 (1%至 10%)、 第一增长阶段(10%至50%)、 第二增长阶段 (50%至90%)、 成熟阶段 (90%至99%)、 衰退阶段 (99%至100%)[25]。

运用软件Logletlab4 中根据S 型曲线拟合人工智能领域的专利增长数据, 获得各参数的拟合统计结果, 如图 2 所示。 拟合优度R2值为 0.988, 表明拟合效果较理想。

图2 人工智能技术生命周期

拟合结果显示, 人工智能领域的技术发展初始阶段为1963—1992 年, 萌芽阶段为1993—2011 年,第一增长阶段为2012—2031 年, 第二增长阶段为2032—2050 年, 成熟阶段为 2051—2070 年, 衰退阶段为2071 年后。

因此, 将现有专利数据划分为三个阶段: 第一阶段为1963—1992 年, 共得到专利合作数据199 项; 第二阶段为1993—2011 年, 共得到专利合作数据1 462项; 第三阶段为2012—2020 年, 共得到专利合作数据3 314 项。

3 专利合作网络三阶段演化

将三个阶段的专利数据导入软件COOC3.9, 并设定截取分析单元频次为2, 从而得到三个共现矩阵。矩阵中对角线上取值为0, 非对角线上矩阵单元V(x,y) 的值代表x与y在人工智能领域合作专利申请的数量。 若x与y在某阶段合作申请专利A项, 则矩阵中对应的值为A; 若x与y在某阶段未曾合作申请过专利, 则矩阵中对应的值为0。

运用Gephi 软件对三阶段的人工智能领域专利合作网络进行可视化处理。 图3 中每一节点代表一个专利权人, 若两节点之间存在连边则说明双方具有合作关系。 此外, 网络中节点越大则说明其合作广度越深,连边越粗则说明两节点之间合作频次越高。

图3 专利合作网络三阶段演化

由图3 可以看出, 在人工智能领域专利合作网络三阶段演化的过程中, 仅具有少数大节点但具有大量小节点, 表明在网络中展开广泛合作的专利权人较少;另外仅存在少数粗连边但存在众多细连边, 说明在网络中进行频繁合作的专利权人尚不多见。

3.1 网络结构特征演化

为进一步探究人工智能领域专利合作网络结构的演化特征, 本文利用Ucinet 及Gephi 软件对专利权人合作网络的节点数、 边数、 网络直径、 网络密度、 平均聚类系数、 平均路径长度6 个指标进行测度, 结果如表1 所示。

表1 三阶段网络结构指标

从三个阶段的网络结构特征看, 节点数分别为34、 686 和 1 316, 边数分别为 40、 3 276 和 9 368, 网络直径分别为1、 13 和14, 均呈现逐步增长趋势, 表示人工智能领域专利合作网络的规模不断扩大, 越来越多的专利权人加入到该领域的专利合作中。 但网络密度分别为 0.067 1、 0.011 1 和 0.007 6, 总体水平较低且存在不断降低的趋势, 表明该合作网络联系不紧密并呈现出日益稀疏的现象。 其平均聚类系数分别为1、 0.666 和0.575, 这一指标的减小同样也证实了这一点。 平均路径长度分别为 1、 5.056 和 4.304, 先上升后下降, 该现象说明人工智能专利合作网络中信息传递效率先降低后升高, 且有进一步提升的趋势。

3.2 块模型演化

运用Ucinet 软件中的CONCOR 程序对人工智能领域专利权人进行块模型分析, 设置最大切分深度为2,集中标准为0.200, 最大重复次数为25, 从而得到树状聚类图和相应密度矩阵。 当密度矩阵中的值大于网络整体密度值时则判定为1 (表示有联系); 当密度矩阵值小于网络整体密度值时则判定该0 (表示无联系), 进一步得到像矩阵 (见表2)。

表2 三阶段密度矩阵与像矩阵

根据像矩阵的0-1 分布值, 得到相应的简化图(见图4)。 图中的节点代表子群, 节点上的箭头表示子群内部之间的联系, 节点之间的连线表示子群之间的联系。

图4 三阶段像矩阵简化图

第一阶段: 像矩阵在对角线上第3 类的值为0,反映出在子群3 中的专利权人合作联系不紧密且合作强度不高, 因此不列入后续简化图的考虑范围; 第1类与第2 类的值为1, 可知整体网络被划分为两大子群, 其原因可能在于在网络演化初期专利权人数量较少且分布位置广泛, 阻碍了专利的合作与扩散。

第二阶段: 随着专利权人数量的增加和网络规模的扩大, 在像矩阵分析中得到一个完全对角的矩阵,人工智能领域的专利权人合作网络被划分为四个子群,并且完全是自反性的。 也就是说, 总体上合作现象只出现在子群的内部成员之间, 而4 个子群之间不存在合作。 可见在这一阶段, 帮派性是非常明显的。

第三阶段: 像矩阵中除了对角线上各个值为1 外,第3 类和第4 类之间也为1, 相较于前一阶段再次升级, 该现象说明各专利权人不再只注重子群内部合作,子群3 与子群4 之间逐渐开展初步合作, 在人工智能领域未来的发展中应保持这一趋势, 各子群内部保持密切合作, 各子群之间加强信息传递与沟通效率。

3.3 专利权人演化

德温特专利数据库将专利权人性质归纳为四类,分别是企业、个人、俄罗斯(前苏联)机构与非标准组织[26],由于俄罗斯(前苏联)机构未出现在本文所用数据中,因此不纳入表3 中。

表3 三阶段专利权人性质

在人工智能领域专利合作网络核心主体的演化过程中, 第一阶段以企业为主, 占比88.2%, 其余则为非标准组织, 占比11.8%; 第二阶段以个人为主, 占比58.6%, 其次为企业, 占比32.7%, 非标准组织数量较少, 占比8.7%; 第三阶段同样以个人为主, 占比53.8%, 企业与非标准组织并重, 占比分别为24.5%、21.7%。 通过与移动通信领域[27]专利合作特征的对比发现: 4G 相关合作专利在成长期以个人为主, 而在成熟期则以企业与非标准组织为主。 将两个领域进行比较, 推测可能是因为人工智能发展还处于发展中期,在未来可能会回归到以组织为主的形式, 即企业与非标准组织是人工智能领域专利合作的主要推动者。 同时目前对创新合作网络专利权人的研究也主要以组织为主, 如段欣等[26]从原始数据集中筛选出性质为标准机构且合作机构大于1 的专利权人进行后续分析, 因此本文选取企业与非标准组织为作为主体进行研究。

3.3.1 专利权人中心度演化分析

中心度是对社会网络中个体权力的定量分析, 描述单个节点处于网络中心位置的程度, Freeman[28]在1979 年提出了度数中心度、 中间中心度与接近中心度三种中心度, 为识别核心节点奠定基础。

度数中心度度量的是网络中与某个节点直接相连的其他节点的数量, 该指标越高表示与该点直接开展人工智能领域专利合作的节点越多, 说明该点处于网络的中心位置。 中间中心度测量的是网络中某一节点居于其他两个节点之间的程度, 该指标越高反映该节点对其他节点开展人工智能领域专利合作的控制能力越强, 其在网络中的中介地位越明显。 接近中心度衡量的是网络中某节点与其他所有节点之间最短距离的和, 该指标说明节点不受其他节点控制的程度, 该指标越小表示该点对其他节点的依赖性越小。 各阶段三种中心度排名前5 的专利权人具体如表4 所示。

表4 三阶段中心度Top5

由表4 可知, 第一阶段所有专利权人的中间中心度均为0, 说明在该阶段中没有处于中介位置的专利权人, 专利权人之间都采取直接合作的方式。 此外,在第一阶段中心度排名靠前的核心专利权人在后面两个阶段中并没有出现, 这表明人工智能领域中发展初期的主导机构并没有积极参与到中后期的专利合作中,合作活跃度并不高。 第三阶段人工智能领域专利合作网络中度数中心度排名第一的是中国国家电网有限公司, 但相较于外部, 合作该企业的内部合作更为活跃,原因可能在于担心自身核心技术泄露, 因此合作研发专利的意愿不强。

国际商用机器公司、 飞利浦公司及中国国家电网有限公司在人工智能专利合作网络演化过程中占据重要地位。 国际商用机器公司在三阶段的排名分别为第3、 第 174、 第 330, 呈现逐渐弱化的趋势, 飞利浦公司也同样呈现下降趋势。 而中国国家电网有限公司首次出现于第二阶段的度数中心度排名中, 在第三阶段则上升至第一位, 发展速度很快。

3.3.2 专利权人所属国家演化分析

按照度数中心度, 三阶段排名前50 专利权人的所属国家集中于美国、 日本、 中国、 韩国等 (第一阶段总共只有28 个专利权人), 结果如表5 所示。

表5 度数中心度排名前50 专利权人的所属国家占比情况

第一阶段日本与美国并列第一, 占比28%, 之后依次为法国、 德国、 中国, 占比分别为 14.2%、10.7%、 7.1%。 第二阶段美国与日本仍位居前二, 度数中心度排名前50 的专利权人中美国18 个, 占比36%, 日本11 个, 占比22%。 而中国在这一阶段排名上升至第三, 占比12%。 在第三阶段中国处于领先地位, 占比达到46%, 其中国家电网的专利数量为186 条, 百度的专利数量为68 条, 腾讯的专利数量为20 条; 美国位居第二, 占比16%, 其中英特尔的专利数量为19 条, 微软的专利数量为42 条; 排名第三的为韩国, 占比12%, 其中三星的专利数量为47 条。

4 结论

本文首先从德温特专利数据库中进行人工智能领域专利数据的检索与下载, 并去除单一专利权人的专利数据, 构建专利合作数据集; 其次将所得专利合作数据集导入Logletlab4 软件进行人工智能技术生命周期的阶段划分, 并在COOC3.9 软件中得到各个阶段的共现矩阵; 然后在Gephi 软件中导入各个阶段的共现矩阵, 构建出专利合作网络; 最后运用 Gephi 及Ucinet得到网络整体演化分析指标数据, 并对专利合作网络进行子群及个体的演化分析以把握其发展趋势, 利用中心度分析识别核心专利权人。

研究发现: (1) 从整体角度来看, 网络规模逐渐扩大, 越来越多的专利权人加入到人工智能领域的研发中, 而合作网络密度较小、 各专利权人之间联系不紧密, 但较松散的网络结构更有利于信息的交流与传递。 (2) 从局部角度来看, 人工智能专利合作发展的各个阶段中均呈现出聚类效应。 在前两个阶段中各个子群只注重内部合作, 体现出了明显的帮派性, 随着该领域的发展, 各专利权人意识到了这一问题, 初步开展子群间的合作关系, 促进了知识的整合与转移。(3) 从专利权人角度来看, 初始阶段企业是人工智能创新的主体, 萌芽阶段的专利权人则以个人为主, 通过与移动通信领域4G 专利技术生命周期与专利权人性质的对比, 推测未来可能会回归到以组织为主的形式。 (4) 从区域变迁看, 在前两个阶段美国与日本占据领先地位, 而中国在第三阶段实现反超, 并涌现了国家电网、 百度、 腾讯等一批在人工智能领域创新活跃的企业主体。

基于此, 在人工智能发展过程中应强化合作创新网络的建设, 网络结构越完善, 信息交流就会越顺畅,各专利权人应积极推动建设信息共享平台, 加强合作密度及强度, 这样才能激发更多的创意和想法,以较低的成本更便利地获得相关知识, 提高创新绩效, 从而使得人工智能产业实现量的增加和质的飞跃。

本研究对全球人工智能领域专利合作网络的演化进行了初步的分析与研究, 但仍存在一定局限性:

第一, 在收集人工智能专利数据时, 本文仅选用主题词进行检索, 未来的研究中可综合IPC 分类号、德温特手工代码等信息, 更深入地挖掘检索式, 以获得更精确的数据源。

第二, 专利合作仅仅只是众多创新合作模式中较为常见的一种, 后续研究可以考虑将论文、 产品等相关数据与之结合, 构建出人工智能领域的知识图谱,从而更为全面地展现出全球人工智能领域产学研合作情况。

猜你喜欢

子群专利权人专利
超聚焦子群是16阶初等交换群的块
专利
子群的核平凡或正规闭包极大的有限p群
发明与专利
对标准必要专利权人拒绝许可行为的反垄断规制
πSCAP-子群和有限群的结构
中国交建3项发明专利荣获“中国专利优秀奖”
16阶非交换2群的子群结构
世界百强企业h指数探析