合作网络和知识网络对AI企业专利创新的影响*

2022-09-20刘嘉明闵超严笑然

图书馆论坛 2022年9期

刘嘉明，闵超，严笑然

0 引言

在研究企业技术进步和创新活动时，与新想法、新技术密切相关的专利数据不仅能够表征企业的技术创新产出，还能帮助企业挖掘领域内的知识流动方向和技术发展趋势[1]，是衡量技术创新能力的重要指标。技术创新是利用和组织知识资源的过程，离不开与其他个体的交流合作。合作网络由个体与个体间的关系构成[2]，知识网络由知识元素及其关系构成[3]，现有研究已证实组织的创新活动在一定程度上受到两种网络的影响，在两种网络中占据特定位置有助于企业进行专利创新[3-10]。探究合作网络、知识网络与企业专利创新之间的关系，能够帮助企业及时调整发展战略，在瞬息万变的市场环境中持续创新。

随着人工智能在基础研究中升温，近年工业界对人工智能技术的应用也愈发明显，如智能导师和教育机器人[11]、新冠肺炎CT影像智能诊断系统[12]，人工智能应用正逐步通过重塑交通、健康、金融等来改变现代生活。发达国家高度重视人工智能的发展与治理，我国也明确了人工智能的发展方向，推动人工智能技术和产业的发展[13]。目前国内图书情报领域有关人工智能的研究大致基于主题、作者和机构三类研究对象，研究内容集中在主题演化与内容分析[14]、新兴技术与研究前沿识别[15]、科研团队的识别与比较[16]、人工智能技术与图书馆的结合[17]等，除宋凯[18]利用案例分析研究人工智能领域的校企合作伙伴选择外，甚少有关于人工智能企业层面的研究。本文围绕人工智能技术创新问题，从人工智能企业层面入手，系统解构合作网络和知识网络对人工智能企业专利创新的影响，为人工智能(AI)企业的发展与技术创新活动提供参考与建议。

1 理论背景与研究假设

合作网络由个体及个体间的合作关系构成，网络中的个体通过正式或非正式交流获取知识[2]。学界普遍认为合作创新可以使合作企业相互交流技术新知识和信息[19]，帮助企业实现资源的优化配置和创新绩效的提升[20]，使处于合作网络中的企业更容易得到实现创新产出的机会。关于企业在合作网络中所处的位置对企业创新产出的影响，大多数学者认为网络结构会通过促进企业的知识交流和资源获取来影响企业的创新能力，在合作网络中居于中心地位的企业更容易得到更好的资源[21]。

知识可以表示为用于发明活动的知识元素的集合，知识网络由知识元素及其关系构成，体现了离散的知识片段和它们之间的联系，专利分类号是一种能够量化知识元素的表现形式[3，22-24]。Yan等[3]利用专利所属的美国专利分类(USPC)类别构建知识网络，发现在替代能源领域，发明人在知识网络中的中心性对其知识创造具有倒U型影响；Guan等[22]、俞荣建等[23]、Zhang等[24]均以专利所属国际专利分类(IPC)类别为知识元素构建网络，分别在不同领域考察了组织知识结构与其创新活动之间的关系。

度中心性、中介中心性、接近中心性、聚集系数和结构洞是描述节点网络位置的重要指标。度中心性描述网络中节点与其他节点的连接程度，节点的邻接节点越多，其度中心性越大，节点在网络中的位置越重要[25]。接近中心性反映节点与其他节点的接近程度，节点的接近中心性越大，意味着它与其他节点的距离越近[26]。中介中心性是以经过某个节点的最短路径数目来刻画节点重要性的指标，可以衡量节点控制网络中信息沟通与资源流通的能力[27]。聚集系数描述节点的相邻节点的连结程度，节点的聚集系数越高，与该节点相邻的其他节点之间联系越多[28]。结构洞体现节点间的非冗余联系[29]，当节点A与节点B、节点C都相连，而节点B和节点C之间不存在联系时，节点A就获得了一个结构洞，占据结构洞的节点是其邻接节点的桥梁。

1.1 合作网络对企业专利创新的影响

在合作网络中，企业的度中心性越大，意味着企业与越多的其他机构或个人存在联系，企业与其合作者之间的知识流动也越多[4]，越能在知识获取、重组潜力等方面获得优势[5]，也更能增加对潜在合作者的吸引力，为后期的合作提供保障[2]。接近中心性高的企业可以更快地联系到网络中的其他机构或个人，从而更加有效地获取所需资源用于创新活动[6]。中介中心性高的企业在与机构或个人的合作中更容易获得高质量、非重复性的信息和资源[7]，占据信息优势和控制优势并决定资源的流动方向[8]。

企业的聚集系数越高，企业的合作者之间的联系越多，合作网络的信息传输能力越强[30]，但高聚集系数也容易导致资源扩散和冗余联系，降低具有联系的群体的创造性[31]，可能不利于企业进行创新活动。占据结构洞的企业是网络中的中介人，能够将彼此没有联系的机构或个人联系起来，控制着关键信息和资源[9]，对企业本身的发展大有益处。也有学者发现，结构洞数过高的企业由于占据网络优势地位而接触过多信息，导致认知超载，反而降低企业的创新能力[32]；结构洞较低的个体更容易跨越已有群体和领域边界，在新领域进行探索和创新[33]，也更容易与合作伙伴产生信任关系，利于资源共享和更高效的协作[34]。现有研究普遍认为，与其他机构或个人合作有助于企业提高创新能力，而企业在合作网络中的位置越关键，越能通过合作获取更多资源。因此，初步假设也与现有研究结论基本一致，即在合作网络中占据重要位置有助于企业进行专利创新。

1.2 知识网络对企业专利创新的影响

在知识网络中，知识元素的组合构造出更大的知识体系。中心性高的知识元素更易到达其他元素，具有更强组合潜力[35]，拥有高中心性知识元素的企业能够在知识网络中获取大量的技术和经验，并更快地接收信息[36]。但知识元素的组合潜力不会无限制上升，随着组合次数的增加，知识元素的科技价值被逐渐耗尽，知识的成熟组合往往导致更多的渐进式创新或较小的修改，很难继续创造出具有新颖性的成果[10]。另外，拥有高中心性知识元素的发明者会因接触到过多的知识而造成信息过载，反而不利于继续创新活动[3]。

知识聚集可能会为企业带来竞争优势，高水平的知识聚集意味着较高水平的知识网络局部连通性，能够形成对某一研究领域的深度思考[37]，也意味着掌握知识的人员通过合作培养了信任和默契[38]。但知识网络中的局部聚集往往意味着不同的研发团队，研发团队之间的资源竞争容易导致企业内部信息、技术的不流通[39]；频繁的局部知识组合也可能会使企业陷入固定的技术轨迹中无法自拔，难以在后续创新中有所作为[40]。一个在知识网络中具有结构洞的知识元素与其他彼此之间没有联系的知识元素结合，形成以自我为中心的知识领域，其周围的知识网络中可能包含着丰富的组合机会[10，41]；同时，占据知识网络中丰富结构洞的元素具有控制知识流动的优势，从而提高涉及该元素的个体的影响力[42]。与合作网络不同，目前对知识网络的研究较少，且不少学者认为知识元素的组合并非越多越好，组合次数的过度增加会使知识元素丧失后续组合所需的科技价值。因此，本研究认为容易组合的知识元素在提升企业专利创新方面存在阈值。

1.3 研究假设

目前缺乏针对人工智能企业专利创新的研究，尤其是从合作网络与知识网络的视角。基于上述分析，本文针对人工智能企业从事专利创新活动提出以下假设。

在合作网络的影响方面：

H1a：合作网络中的中心性(度中心性、接近

中心性、中介中心性)正向影响企业的

专利创新产出。

H1b：合作网络中的聚集系数负向影响企业

的专利创新产出。

H1c：合作网络中的结构洞数正向影响企业

的专利创新产出。

在知识网络的影响方面：

H2a：知识元素在知识网络中的中心性(度中

心性、接近中心性、中介中心性)倒U

型影响企业的专利创新产出。

H2b：知识元素在知识网络中的聚集系数负

向影响企业的专利创新产出。

H2c：知识元素在知识网络中的结构洞数正

向影响企业的专利创新产出。

2 研究设计

2.1 数据来源

本文所使用的专利数据来自LENS①。由于人工智能是一个综合性领域，包含机器学习、自然语言处理、模式识别等子内容，本文通过限定专利标题中的关键词和专利所属IPC分类号构建检索式，选取2011-2019年出版的355，638条公开专利进行分析。

2.2 数据处理

专利申请人主要分为个人和机构两类，其中机构包括企业、高校、研究所等。由于本文探讨的主体对象为企业，因此以合作申请专利的企业为核心申请人，其合作者不限制类型。生成核心申请人列表的方法包括：(1)形成包含机构及个人的初始申请人列表；(2)根据co ltd、llc、corp等企业名称常用缩写，从初始申请人列表中筛选并形成初始核心申请人列表；(3)根据发明人字段从初始申请人列表中剔除部分个人申请人；(4)根据university、school、college等高校名称常用词和institute、research等研究所名称常用词，从初始申请人列表中排除高校和研究所；(5)人工筛选无法通过名称辨别类型的初始申请人，与初始核心申请人列表整合形成最终核心申请人列表。由于本研究探讨企业的合作、知识网络特征对未来专利创新的影响，以3年为时间窗将数据分为2011-2013年、2014-2016年和2017-2019年3个时间段，选取2011-2016年的合作专利共35，162条(占6年内全部专利数量19.6%)和14，913家企业进一步分析，构建2011-2013年、2014-2016年的合作与知识网络。在限制企业2011-2019年间专利申请数量不得少于5个、企业须在连续两个时间窗内均有专利申请后，最终得到680家企业的1，061条样本，每条样本都代表一个企业在某一时间窗内的合作网络、知识网络特征及其在下一时间窗内的专利创新产出。

2.3 研究变量

(1)因变量。因变量为企业未来的专利创新产出，分别采用专利产出[7]及专利质量(即专利被引频次)[1，3]来衡量。企业在某一时间周期内的专利产出以该周期申请的专利数量表示。考虑到申请时间较遥远的专利可能会被更多后续专利引用，某专利的质量以被其他专利引用的年均频次来衡量，每个企业的专利质量则为企业参与申请的所有专利的年均被引频次之和。

(2)自变量。自变量包括企业在专利合作网络中的、企业的知识元素在知识网络中的度中心性、接近中心性、中介中心性、聚集系数和结构洞数(以下简称“位置指标”)，自变量计算公式见表1。企业的知识元素在知识网络中的位置指标为该企业参与申请的全部专利的知识网络位置指标的平均值，专利在知识网络中的位置指标为该专利涉及的所有IPC类别(完整分类号，如G06F17/50)的知识网络位置指标的平均值。

表1 自变量计算公式

(3)控制变量。①专利族数：包括简单专利族数(Simple Patent Family)和扩展专利族数(Extended Patent Family)。简单专利族指一组专利族中的所有专利都以共同的一个或共同的几个专利申请为优先权。扩展专利族指一组专利族中的每个专利与该组中的至少一个其它专利至少共同具有一个专利申请为优先权。专利族大小可以体现发明在技术和经济上的重要程度[43]。②非专利参考文献数：专利文献引用非专利文献的数量，体现专利对科学知识的吸收与利用[44]。③技术宽度：本文按照专利所属的IPC号前4位(如G06F)统计技术宽度。专利涉及的技术分类越多，专利所覆盖的技术范围越广，越有可能被更多的专利引用，专利的影响力越大[4]。④布局国家数：企业专利的布局国家数反映了企业的国际市场开拓程度，布局国家数越高意味着专利的地域保护范围和影响力越大[45]。⑤技术基尼系数：基尼系数是用于衡量居民收入差距的常用指标[46]，本文利用基尼系数来衡量企业的技术分散程度，见公式(6)。其中，|Yj-Yi|是某一企业参与申请的所有专利中，任意两个技术分类出现频次的差值的绝对值；n是该企业参与申请的所有专利包含的技术分类的个数；u是该企业参与申请的所有专利中，技术分类出现频次的平均值。基尼系数越接近1，意味着企业的技术布局越集中；基尼系数越接近0，意味着企业的技术布局越分散。

3 研究结果与分析

3.1 变量统计特征及相关性

本研究所使用变量的类型、名称及缩写如表2所示。由于一些自变量之间相关系数较大且显著②，为保证结果不受到多重共线性的影响，将每个自变量单独纳入模型中；每个模型的VIF值均不超过10，不存在多重共线性问题。

表2 研究变量

3.2 假设检验及分析

以专利产出为因变量时，鉴于因变量为计数变量且均值与标准差不相等，采用负二项回归方法，显著的回归结果见表3模型(1)-(7)。以专利质量为因变量时，由于因变量为连续变量，采用多元线性回归方法，显著的回归结果见表3模型(8)-(10)。模型(8)-(10)验证了H1a中有关企业合作网络中心性与专利质量的正向影响关系(模型(8)：r=0.890，p＜0.01；模型(9)：r=95.522，p＜0.05；模型(10)：r=2，913.260，p＜0.01)，说明AI企业能够通过广泛、密切的合作交换信息总结经验，进而提升专利创新质量，但合作并不一定带来创新产出的增加，H1a中有关专利产出的部分未能得到验证。H1b、H1c分别通过模型(2)和模型(3)验证了企业在合作网络中的聚集系数与专利产出的负向关系(r=-0.504，p＜0.01)、结构洞与专利产出的正向关系(r=0.612，p＜0.01)，说明在合作中占据桥梁位置有助于AI企业产出更多专利，但专利数量与质量的提升不具有一致性，H1b、H1c中有关专利质量的部分未能得到验证。

表3 回归结果

依据模型(4)-(6)，知识元素在知识网络中的度中心性、接近中心性和中介中心性都对企业专利产出具有显著正向影响，对H2a在专利产出部分是否成立的验证将在下一节中与其他一次项显著的变量一起进行。知识元素聚集系数与企业专利产出的负向影响关系在模型(7)中得以验证(r=-1.688，p＜0.01)，表明知识局部聚集容易使AI企业丧失持续创新能力，H2b专利产出部分成立。而知识元素结构洞数对企业专利产出及专利质量均不具有显著影响，H2c不成立。知识元素位置不能显著影响企业专利质量，说明提升创新质量需要对知识元素进行更深层次的探索，而非对知识元素进行简单组合。

3.3 非线性效应及稳健性检验

为探讨知识网络中心性是否对专利产出和专利质量具有倒U型影响，将知识网络中心性的平方项加入模型中进行分析，同时将其他一次项显著的变量的平方项纳入回归进行稳健性检验。因变量为专利产出的分析结果如表4模型(1)-(5)所示，因变量为专利质量的分析结果如表4模型(6)-(8)所示。

表4 平方项回归结果

因变量为专利产出时，合作网络接近中心性、知识网络接近中心性、知识网络聚集系数的平方项均不显著，与专利产出的非线性关系不成立。模型(1)-(2)表明，合作网络聚集系数、结构洞数可能与专利产出存在非线性关系；由模型(6)-(8)可见，合作网络中心性可能与专利质量存在非线性关系。模型(3)-(4)中，知识网络度中心性和中介中心性的平方项均显著且系数为负，可能与专利产出存在倒U型关系。

为进一步验证平方项显著的自变量与因变量是否存在显著的非线性关系，以各自变量与各因变量的散点图及二次曲线拟合图作为辅助工具继续探究。因变量为专利质量，自变量为合作网络中心性时，二次项为正的曲线均集中分布在曲线对称轴右侧，即合作网络中心性对专利质量具有正向影响，H1a在专利质量部分成立。当因变量为专利产出、自变量为合作网络聚集系数时，曲线二次项为正，且集中分布在曲线对称轴左侧，证明合作网络聚集系数对专利产出具有负向影响；因变量为专利产出、自变量为合作网络结构洞数时，曲线二次项为正，且集中分布在曲线对称轴右侧，证明合作网络结构洞数对专利产出具有正向影响，H1b和H1c在专利产出部分成立。因变量为专利产出、自变量为知识网络度中心性和中介中心性时，二次曲线图像均为倒U型，即知识网络中心性倒U型影响专利产出，说明企业初期利用组合潜力高的知识元素能够促进自身专利产出，但重复组合的知识元素不能持续推动企业专利创新，H2a在专利产出部分成立。另外，为保证研究结果的可靠性，以IPC分类号前4位(如G06F)区分知识元素并重复了研究过程，得到的结果与采用完整分类号的结果基本保持一致。

可见，企业在合作网络中占据中心性较高的位置有助于提升其专利创新质量，但无益于增加专利产出数量；合作网络中处于低聚集系数、高结构洞的位置的企业更容易申请更多专利，但在创新质量上的优势不明显；知识元素在知识网络中的中心性对专利创新数量存在先促进后抑制的作用，知识元素的聚集系数负向影响专利创新数量，但知识元素的位置对企业的专利创新质量并无显著影响。

4 结论与启示

4.1 研究结论

合作网络层面，企业占据合作网络中心性较高的位置有助于提升专利创新质量，占据桥梁位置有利于提升专利创新数量。社会关系广泛、密切的企业更容易与合作者交换资源和信息，从而吸取经验，在高效的合作中开发出具有实用价值的高质量专利。但密切的合作不意味着专利产出的增加，处于成长初期的企业研发能力较弱，倾向于寻求外部合作以满足创新需求，而具有完善设备和技术的企业研发能力较强，往往偏好独立研发。在合作中占据桥梁位置的企业通常拥有关键技术和资源，这类企业在合作中不可或缺，因此容易产出更多的专利，但受到合作企业水平、市场导向等因素的影响，能够充分利用企业资源为后续产业发展带来持续价值的创新仍是少数，创新数量上的优势并不能保证创新质量的同步提高。

知识网络层面，容易组合的知识元素对企业的专利创新数量具有先促进后抑制的作用，频繁局部组合的知识元素会抑制企业产出更多专利。在创新过程的初期，企业充分利用可行性高、组合潜力强的知识元素能够极大程度提高专利产出数量，但随着频繁的局部知识组合和市场的成熟，企业容易面临同质化的风险，陷入陈旧的技术轨迹，难以持续拓展创新。另外，知识元素的简单组合不意味着高质量创新的产生，知识元素组合难易程度并不能显著影响企业的专利创新质量。

以往研究大多认为合作网络对企业技术创新产出具有良好的促进作用[2，4-9，30-31]，而知识网络对企业技术创新的作用则是先促进后抑制[3，35，40，42]。本文在人工智能领域，不仅验证了其他领域的早期研究结果，还进一步证明：占据合作网络的桥梁位置有助于提升专利创新数量，无助于专利创新质量，但是占据合作网络的中心位置则有助于提升其专利创新质量，而企业拥有的知识元素在知识网络中的位置同样不能影响其专利的创新质量。

4.2 管理启示

首先，管理者应该从单纯关注技术知识的内容特征转向同时关注技术知识的结构性特征在创新中的作用。即便是相同数量和类型的技术知识，通过不同组合形式也会形成多样的知识结构，管理者应该花更多资源来优化企业的技术知识结构。人工智能是我国大力支持的高端产业，各地“一哄而上”的产业布局容易引发重复建设和同质化问题[47]。人工智能企业应该选择在知识网络中处于核心边缘位置、具有重要发展潜力的新兴技术领域进行重点投入研发，在关键领域和“卡脖子”技术上寻求突破。

其次，作为高端技术领域内的企业，人工智能企业在合作研发中应该更多承担“挑大梁”的中心研发角色，而不仅是资源传递者的中介角色，以此发挥社会资本的最优价值。为了掌握高质量的创新技术，人工智能企业需要成为外部合作网络的核心行动者，占据领导地位。当前，人工智能产业的技术深度与产业发展均处于初级阶段，商业化过程仍将十分漫长[48]。充分借助社会资本，加强与其他企业、高校、研究所等机构以及个人的合作，有助于为人工智能企业构建起资源共享、人才集聚、协同创新的产业链条。

基于2011-2019年人工智能领域的全球专利数据，本文构建680家企业的合作网络及知识网络，实证检验了不同网络位置对人工智能企业技术创新的作用机制，弥补了人工智能相关实证研究大多集中在基础科学或院所层面的不足，从企业角度揭示促进人工智能技术创新的机制与建议。本研究的不足之处在于，文章采集的数据是切片数据，不能体现企业创新产出的动态变化，未来研究可以考虑采用时间序列数据，并加入合作网络与知识网络对人工智能企业技术创新的交互作用。

注释

①资料来源：https：//www.lens.org/.

②受篇幅限制，不一一呈现。相关系数较大的几对自变量：DC和BC(r=0.927，p＜0.01)，CC和SH(r=-0.782，p＜0.01)，IDC和IBC(r=0.844，p＜0.01)，ICLC和ISH(r=0.870，p＜0.01)。