APP下载

专利文献被引的影响因素*

2022-09-20姚毅凡

图书馆论坛 2022年9期
关键词:专利数量领域

姚毅凡,沈 喆,王 毅,成 颖

0 引言

十九大报告强调创新是引领发展的第一动力[1]。专利作为技术创新的成果,已经成为集技术、科学、法律以及经济等信息为一体的重要信息源[2]。目前对专利的计量分析已经引起了图书情报学[3]、管理科学与工程[4]、经济学[5]等多个学科的关注。宏观层面,专利分析有利于学界与业界把握技术前沿、推动学术交流、促进学科发展、激发技术创新并进而创造经济价值和社会价值。微观层面,对专利进行引用分析已经成为专利计量学的重要方法,被广泛应用于识别核心专利[6]、评估企业专利价值[7]等,具有易用、高效等特点[8]。

目前专利计量学界普遍接受的观点是,专利被引体现了其经济价值和技术水平[9-11],可以衡量其对后续技术的影响,体现了其作为现有技术的法律功能[12],是专利质量评价指标体系不可或缺的维度[13-14]。值得关注的是,专利被引存在明显的二八定律,即少量专利获得了大量的引用,而更多的专利被引甚少,甚至零被引。学界深入探讨此现象背后的原因,发掘出了丰富的影响专利被引的因素。结果显示,专利的被引频次会受到发明人、专利权人、技术范围、国家以及时间等多种因素的影响。

现有研究尚未见对专利被引影响因素的全面梳理,考虑到该主题重要的科学意义与应用价值,本文对其进行系统综述。借鉴Tahamtan等[15]的做法,本文在Web Of Science、Scopus、PubMed和LISA等数据库中采用TI=(Determin*OR Factor*OR Effect*OR Relation*OR Influence*OR Impact*OR Predict*OR Function*OR Significance*OR Feature*OR Characteristic*OR Distribution*OR Increas*)AND TI=(Patent*)AND TI=(Citation*)进行检索,中国知网的检索策略为限定主题中包含“专利”及“被引”或者“专利”及“引用”,首次检索时间是2019年12月5日,并于2020年11月18日进行了补充检索,结合参考文献,排除无关论文,最终获得相关文献共87篇,其中中文文献65篇、英文文献22篇。

1 专利被引的影响因素

通过对相关文献的主题分析,提炼出14个被引影响因素,并将其概括为3类,即“后向引用因素”(后向引用文献数量、后向引用文献质量、引证深度以及引证广度)、“专利自身因素”(时间、早期被引、IPC分类数、专利主题、权利要求数量、同族专利数量)、“专利产生因素”(专利权人、合作、国家、资金),见图1所示。

图1 专利文献被引影响因素

1.1 后向引用因素

后向引用(backward citation)指展现于专利参考文献列表中的对先前专利和非专利文献的引用,一定程度上反映了专利接受的知识溢出[16]。其中,非专利文献(non-patent literature,NPL)指后向引用了专利文献以外的其他文献,通常包括科技图书、期刊论文以及索引工具等[17],该类引用可以在一定程度上体现科学与技术之间的联系,比如,对美国生物技术行业以及纳米技术领域的分析发现后向引用NPL是科学与技术之间的桥梁,基于我国在美申请的医药领域专利的分析进一步发现引用了NPL的专利获得了更多被引,可见科学与技术之间多方面的相互作用[18-20]。

1.1.1 后向引用文献数量

多项研究探讨了后向引用专利文献和NPL的数量对被引频次的影响。后向引用专利文献的数量越多,则被引频次也就越高[16,21];但在新兴产业燃料电池领域中,该结果在不同数据集上的表现并不稳健[22];而使用零膨胀负二项回归和突变级数法对传统产业中药专利进行的分析显示,无论静态抑或动态视角均发现了显著的负向影响[23]。

NPL数量与专利被引频次的关系研究中未发现二者间的显著正向影响[24]。部分学者聚焦于NPL中的部分文献类型,发现高被引专利引用了更多的科学文献[22,25],也有研究在动态模型中发现其影响随着时间的推进逐渐由消极转变为积极,而在静态模型中影响则不显著[23];在仅探讨NPL中学术论文数量对专利被引频次的影响时,多项研究中均发现了显著的正相关关系[16,21,26-27],不过,该结果在中药专利中未能重现[28]。对于科学论文之外的其他文献,研究中未发现其数量对专利被引频次的显著影响[27],个别研究中甚至发现了二者间的负相关关系[16]。

1.1.2 后向引用文献质量、引证深度和广度

除了后向引用文献数量外,相关研究分别探讨了后向引用专利文献质量、引证深度以及广度对被引频次的影响。少量研究中将后向引用文献质量量化为其被引数,分析发现后向引用科学论文的质量对专利被引存在显著正向影响,后向引用专利文献的质量对专利被引不显著[26];采用HHI指标量化的引证深度指标对专利被引存在显著的正向影响[29]。

引证广度即“一项专利所引证的不同技术领域的数量”,可通过后向引用专利的UPC以及IPC等分类数进行量化,相关分析显示其在整体上与专利被引呈显著的正相关关系[30],多元回归分析的结论与之相似[31-32]。此外,针对后向引用专利的IPC分类数,其在高低被引专利之间存在显著差异[33];而且在用后向引用专利的IPC分类信息熵量化技术会聚时,结果也表明5个分类层级的技术会聚程度均对专利被引频次存在显著正向影响[34],研究中还发现随着技术会聚程度的增加,其间关系呈倒U型,且交叉领域的影响显著高于非交叉领域[35]。不过,少量研究未证实引证广度对被引的正向影响[29]。

1.2 专利自身因素

1.2.1 时间

专利被引频次需要时间的积累,越早出现的专利,其被引的概率越大[36],该观点已经成为众多实证研究的共性结论,但不同学者对时间的量化方式存在差别。专利被引频次可能会受到专利年龄的影响[37],部分研究还发现其遵循Logistic扩散模型[38-39],优先权年越早的专利可以获得更多的被引[40];通过对美国国家经济研究局(the U.S.National Bureau of Economic Research,NBER)六大技术领域的方差分析也发现年龄大于20年的长期专利的平均被引显著高于中短期专利[41]。值得注意的是,专利被引存在“时间截面”“引证膨胀”[12]“队列效应”[42]等问题,不同年份公开的专利可能无法直接比较,鉴于此,有学者利用固定效应法对专利被引频次进行了修正,发现若固定公开年,则专利被引频次随统计年的增长呈上升趋势,若固定统计年,则其与公开年的关系呈倒U型[43]。

1.2.2 早期被引

研究表明早期被引次数越多的专利未来被引的可能性越大[44]。生命表法关注的是专利授予和首次被引的时间差,结果发现一半专利的首次被引发生在授予日后的前125个月(前10年)内[45]。具体到专利被引的时间分布,有研究通过对11项样本专利的引文分析发现,专利公布后的前一两年内几乎没有被引,被引量从第三年开始大幅增加,一般在第四或第五年达到高峰[46];专利授予年与首次被引用年之间的时滞越长,专利被引将越少,即被快速引用的专利将获得更多的引用[47]。此外,也有研究将专利划分为高、低被引两类并结合Logistic回归分析,结果显示专利发布2年内的被引证数对总被引存在显著的正向影响,而首次被引时间的影响不显著[29]。

1.2.3 IPC分类数

IPC分类是目前国际通用的专利文献分类和检索工具,采用部、大类、小类、主组、分组5级分类的方式[34],可用于确定专利所涉及的技术领域范围。专利的IPC分类数越多,表明专利覆盖的技术范围越广。学者们探讨了专利本身的IPC分类数对专利被引的影响,结果发现二者间呈显著的正相关关系[30-32,48-50];采用DC分类法的研究也显示专利的技术多元化特征越明显则越有可能产生重大的发明创造(即高被引专利)[51]。

1.2.4 专利主题

多项研究从宏观的主题视角对专利被引进行了分析,结果发现不同主题专利的被引量存在显著差异,如美国专利商标局10个高被引专利中有7项都属于喷墨技术及相关主题[52];中国专利的类似分析也表明人类生活需要类专利的被引频次最高[53-54]。在具体的主题领域中,在移动支付领域,关于移动支付的相关技术、体系结构及解决方案等子主题具有被引优势[55];在生物技术领域,与微生物技术相关的专利平均被引超过100次,而“抗生素”“维生素”“激素”“甲状腺激素”“前列腺素”等主题被引甚少[56];在加密技术领域,加密通信系统和方法类专利获得了更多的被引[57];在全球密集型企业(全球范围内拥有的专利数量最多且专利总被引次数最大)专利的引用分析中,“电子、电气设备”行业被引频次最高,技术知识溢出明显[58];美国洛克希德·马丁公司的高被引专利也集中于化学、计算机与通信领域[59]。少量研究还探讨了专利主题的相关特征与被引间的关系,如专利主题的新颖性和常规性以及二者的交互作用均对被引存在正向影响[60];部分研究还探索关键词模式对专利被引的预测价值[61]等。

1.2.5 权利要求数量

权利要求体现了专利的保护范围,权利要求数量越多,则保护的范围越大[62]。部分研究发现权利要求数量对专利被引频次存在显著正向影响[37,40,49]。在生物技术领域中,负二项回归分析表明权利要求数量对专利被引的影响呈倒U型曲线,作者的解释是随着权利要求数量的增加,与专利申请领域相关的不确定性随之增加,从而会降低使用该专利作为后续技术来源的可能性[63]。1.2.6同族专利数量

同族专利是“根据同一发明创造,在多个国家或者地区进行的专利申请或者专利授权,或者在同一国家多次进行的专利申请或者专利授权而形成的专利组合”[64],亦被称为专利家族。同族专利可表征专利权人对专利质量的主观判断和后续投入[16],多项研究表明其与专利被引频次正相关[16,48];也有研究显示三方专利家族(是否同时在日本、欧盟和美国申请并授予专利)对专利被引频次存在显著负向影响[29]。此外,有学者采用ERG模型分析专利引用关系的形成机理,结果显示专利家族规模、非专利引文、专利申请范围等特征在其中的影响被高估[65]。

1.3 专利产生因素

1.3.1 专利权人

专利权人(专利申请人、专利受让人)是专利权的所有人及持有人的统称,可以是单位或个人[66],其类型特征会对专利被引产生一定影响。研究发现,机构专利的被引频次要高于个人[47]。在机构中,大公司和高水平大学、科研院所、实验室等拥有的重要且具有影响力的专利技术,会获得更多引用[67-68]。不过,在我国医药领域中,相较于大学、研究所及个人专利权人,企业专利权人在专利被引频次上优势明显[69]。针对企业,在位主导企业(专利市场份额前三、五位)与否对专利被引未见显著影响[22],机构持股比例则对上市公司创新质量(专利被引)存在显著促进作用,尤其是长期、主动的机构投资者[70]。

多项工作对我国高校专利权人的专利被引进行了研究。我国985高校间的专利竞争力差异明显,就高被引专利比例来看,西北工业大学、清华大学、厦门大学和复旦大学远高于其他高校[71];C9高校的专利申请数量均表现出增长趋势,但专利被引频次存在较大差异,其中清华大学优势明显[72];广东7所高水平大学中,华南理工大学专利的转化率处于领先位置[73]。

最后何冰铁了心搬了出来,同时放话给赵晓峰:现在同意离婚的话,房子家产自己都不要,等到分居期满,自己绝对要他人财两空。

1.3.2 合作

现有研究中,合作可通过发明人数量、产学研合作以及跨国合作等进行量化。

(1)发明人数量。高被引专利的发明者合作率、合作强度(即平均每项专利的发明者数量、单项专利最高发明者数量)均高于中低被引和零被引[74];燃料电池[22]、纳米领域的区域引证分析[48]也显示发明人数量对专利被引存在显著正向影响;进一步,平均拥有8个及以上共同发明人的专利在前5年被引的频率明显高于拥有较少发明人的专利,在对专利的技术领域、受让人部门(公共/私营)、引用来源(申请人/审查员)、自引等进行亚组分析时该关系依然成立[75];也有部分研究显示发明人数量对专利被引的影响不显著[16,29,40]。

(2)产学研合作。在以平均被引频次表征专利质量时,研究发现1978-2005年间中日两国校企合作专利质量整体上高于非校企合作,但该差异在韩国并不明显[76],也有研究表明产学合作确实有助于提高专利质量[77-78];针对高校(双一流、其他)和企业(国企、民营、其他)之间可能存在的六种产学协同创新主体,其被引分析表明民营企业和其他高校合作的专利被引频次较高[79]。

(3)跨国合作。在以国家为单位的研究中发现专利跨国合作次数对国家专利产出的数量和被引频次均存在显著正向影响,即跨国专利合作能促进本国产生数量更多、影响力更大的专利[80];对中国ICT领域的专利分析也显示,相较于国内合作,国际合作对专利被引的影响更大,其中中美合作在提高专利质量方面的优势更为明显[81];此外,也有研究表明与美国专利所有权合作对专利被引频次存在显著正向影响[50]。

1.3.3 国家

专利被引频次存在地理上的差异,部分研究证实了专利引证行为会受到其所属国家的影响。比如,法国专利被引用的次数少于英国专利[47],美国专利被引和引用频次均居全球首位,韩国专利引用频次是被引的近乎两倍,德国被引则远多于引用频次[82]。

现有研究发现美国和日本专利质量在全球多个领域的优势地位。比如,在微生物燃料电池[83]、临氢/供氢剂减黏裂化技术[84]、医用治疗设备[85]、电子诊断设备[86]、马铃薯淀粉深加工[87]以及分子设计育种[88]等领域,美国专利的被引表现均优于其他国家。日本占据美国专利商标局10个高被引专利的7席[52],且相较于中韩,其专利的总被引频次也明显较高[76];此外,在全球液晶显示产业中,日本半导体能源公司(SEME)平均被引也是最高的[89]。总体而言,我国专利被引频次与发达国家相比还存在较大差距[90-93];不过,在金砖五国中我国专利的被引情况仍处于领先地位[94]。1.3.4资金

有关资金,学界关注到的主要有专利申请费用以及财政资助。围绕前者,选取美国1982年和2005年两个专利申请费用上调和下调时间点来进行对比分析,可以发现专利申请费用上调后低被引专利比例降低,下调时则上升[95]。针对后者,现有研究从多个角度进行了探讨。对于国家而言,研发经费投入对国家专利被引频次存在显著正向影响[80];就区域而言,科技经费筹集额与区域专利被引频次正相关[48];此外,对于企业而言,研究发现世界主要钢铁企业的研发投入率和投入额与总被引频次也高度相关[96]。不过,也存在即使投入了大量资金,专利影响力仍然较低的情况(如对中石油的专利分析结果)[97],即资金投入对专利被引的影响尚不能一概而论。

1.4 其他

2 影响因素间的相互作用

本文综述的三类影响专利被引的因素间也存在相互作用,具体表现为学科领域的调节效应、专利产生以及专利自身因素对专利自身的影响、专利产生对后向引用的影响等。

2.1 学科领域的调节效应

不同学科领域的专利后向引用科学文献存在很大差异,表现为在临床医学、基础医学、生物学、化学以及物理学等学科中科学与技术之间的联系更强,而数学等学科较弱[101-102];与其他技术领域相比,化工领域专利后向引用的非专利文献量较高[103];与纳米和转基因技术领域相比,制药领域知识更新缓慢,参考周期较长且科学知识转化为技术的速度较慢[104]。即使在同一领域中,不同子领域也表现迥异,比如动力电池领域,锂电池和燃料电池后向引用科学论文的数量对专利被引频次存在显著正向影响,镍氢电池的该影响则不显著[21]。此外,后向引用非专利文献、权利要求数量等因素对专利被引的影响在生物技术行业内外存在差异[63];时间因素对专利被引频次的影响在不同技术领域也不一致[43];而且,一项专利的技术变异度越大,获得的被引将越多[47]。

2.2 专利产生以及专利自身因素对专利的影响

专利维持时间作为与专利自身相关的因素之一,多项研究发现多个与专利产生以及专利自身相关的其他因素对其存在一定的作用。比如回归分析发现发明者人数(合作)、IPC分类数、权利要求数、同族专利数等因素对专利维持时间存在影响,且这些因素对不同类型专利权人的影响程度存在差异[105];中国、美国、法国和德国专利的权利要求数对维持时间存在显著正向影响[106]。此外,在另一与专利自身相关的因素——早期被引上,也得到了类似的发现,比如,与第一发明人相关的变量(发明数量、发明被引次数)会影响早期被引的速度[45],具体表现为第一发明人在领域内获得的被引频次越高,则专利首次被引的时间就越短,其专利发明数量越多,则该时间越长;随着IPC分类数以及同族专利数量的增加,则专利的首次被引时间在不断前移,同时,随着权利要求数量的增加而不断延迟[107]。

2.3 专利产生对后向引用的影响

不同国家专利后向引用存在较大差异,比如相较于日本,中国专利后向引用专利文献的数量更多且范围更广[108];在中国、美国、瑞士以及德国四个国家中,美国专利的科学关联度(后向引用论文数量)一直高于平均水平[109]。而且,不同类型专利权人引用科学文献的平均数量也存在较大差异,高水平大学科学关联度较高[68]。此外,财政资助专利[110]和存在专利运营(专利权人获得授权以后对其有收益、处分的权利,最常见的就是质押、许可和转移,统称为专利运营)[28]现象的专利在引用科学论文上的表现也要高于其他专利。

3 讨论

3.1 影响因素与被引间关系的不一致性

通过本文第一和第二部分的梳理发现,影响因素与专利被引间的关系在多项研究中表现不一致,相关研究也探讨了其内在机制。

3.1.1 法律规定对引用行为的影响

不同于科学论文,专利引证包含申请人引文和审查员引文[111],前者一般是展示该发明的现有技术,后者则是为了限制专利权利要求[112]。在专利法的约束下,申请人的引用通常作为技术背景指出先前研究存在的问题或局限,是被引专利先进性的负面证据;审查员引文则是为了提供驳回申请的理由,授权专利获得的引用越多其新颖性越经得住考验[113]。引用行为还会受到激励政策和信息素养的影响,例如,当把申请驳回率当作绩效指标时,审查过程会更加严苛[114],二者尤其是申请人的引用能力会受到检索能力和文献资源获得能力的影响[115]。此外,各国专利法对引用行为的规定也存在差异[116],比如,中国和EPO等国家和地区并没有类似美国的申请人“坦诚义务”,同时,前者的专利数据库中大多只包含审查员引文,而后者的相关数据库则包含了二者,从而审查员引文在可获得性和数量上都有明显优势[117]。

专利引证数据是申请人和审查员基于各自的引用动机和引用能力,在专利法规的作用下形成的结果[115],其中引用主体属性的不同造成了最终数据的差异,故在进行相关研究时应区分申请人和审查员引用[114],以获得更为精细的样本。此外,不同国家专利引用法规的差异也提醒研究者在构建样本时对引证数据加以区分,在进行跨领域、跨地区研究时尤甚。

3.1.2 本土优势

多项研究发现不同国家的专利被引存在差异,比如美国无论在引用还是被引都处于世界前列,相关研究通过对引用行为的分析揭示了本土优势的影响。比如,目前中国专利的被引在世界范围内尚未体现出优势,却存在明确的本土优势,即总被引频次和篇均被引频次均高于国外来华发明专利[103]。技术知识在语言[46,118]和地理距离[118-119]相近的国家间传播得更快。专利授权机构借助于专利审查/批准的法律规则和程序也促进了本土优势[120]。不过,随着国际通讯和旅行成本的下降,信息跨越国界流动变得更加容易,本土优势呈逐渐减弱之势[121]。

3.1.3 后向引用文献类型

一是专利文献。新的技术发明通常建立在前人的研究基础之上[22],后向引用专利文献有助于打破固有思维模式、突破技术限制,如果引用涉及不同的技术领域,可形成思维碰撞、产生新突破[23]。不过,引用大量专利文献会限制专利的权利范围,且专利文献质量参差不齐,引用低质量专利文献会降低专利的新颖性和创造性[23,49]。此外,从技术生命周期来看,越接近起点的专利越基本,也越重要,其后向引用的专利文献也越少[42]。二是科学文献。基础研究为发明创造提供了理论基础和方法指导,后向引用更多的科学文献可以增强专利发明人前沿科学知识的储备和知识结构的异质性,提升创新能力,继而提高技术创新的质量[20]。此外,科学文献从经济学角度来看具有公共物品非竞争性和非排他性两个基础特性[22,25],个人对科学文献的引用并不会降低其价值更不会影响他人,引用过程促进了知识的流动,有利于创造新知识,故而科学文献具有正外部性。不过,科学文献的质量、年龄均存在差异[26],且后向引用科学文献的动机多样,部分引用难以体现科学与技术的联系[19]。3.1.4同族专利数量

一项专利能够通过专利审查,在不同国家获得授予,既表明该专利自身质量较高[20],也显示出专利权人对其价值以及未来潜力的肯定和重视[29],同族专利也可以减轻距离和语言差异对专利知识扩散的负面影响[46]。不过,专利权人的主观判断和规划会受到自身的限制,相比于规划明晰的大企业,实力较弱的中小企业更可能因为缺乏前期市场调查而致盲目申请,进而耗费更多的人力、物力和财力[29]。

3.1.5 发明人数量

较多的专利发明者汇聚了丰富、多源的知识,显示了该专利人力资源投入以及潜在质量较高[16]。不过,有必要考虑发明者之间顺利合作需具备的一些前提条件,如知识的多样性、个人观点的独立性、不存在特殊权利以及其他准则等[122]。此外,还需要关注林格尔曼效应[123],即团队中的每个个体是否发挥了其最大的价值。

3.2 专利被引频次

现有专利被引影响因素研究的一个基本假设是专利被引频次可以衡量专利质量。不过,有研究认为即使是被引证数为0的专利依然可能是高价值专利[36],是“放错地方的资源”[10]。多项研究提示,该量化方法的鲁棒性不够充分[124-125]。其原因可能有,被引频次具有时间滞后性、见树木不见森林(单篇专利之间的引证关系难以体现技术之间的整体关联)、判断阈值无法形成统一标准、不当引证时有发生、公众获取中国专利引证信息困难[8]、技术领域差异[12]以及个体检索能力提升导致的引证膨胀[12]等。针对存在的这些问题,有学者采用固定效应法分析了时间因素对专利被引频次的影响[43],也有学者对原始被引频次指标进行了标准化(除以同一年份和同一专利分类中所有专利被引用的平均数量),并针对不同技术领域、引用来源等进行了亚组分析[75]。

3.3 研究方法

专利被引的影响因素研究主要采用了三类方法。相关分析:在考虑单一因素与专利被引频次之间的相关关系时多采用该方法,包括Spearman、Kendall's tau-b以及Pearson等相关系数,其中Spearman相关系数对原始变量的分布要求较弱,在研究中更为常见。回归分析:研究中常用的回归分析方法有负二项回归、Logistic回归、Tobit回归以及Cox回归等。在专利被引影响因素研究中,由于被引频次是非负的离散整型变量,计数模型更为适宜[16],其中负二项回归是更为常用的方法。在仅考虑专利分类、发明人以及现有技术的参考资料等事前指标(exante indicator)时,深度学习方法在预测专利被引方面的表现要优于引文滞后分布和Tobit回归[126]。此外,有学者将负二项回归与其他研究方法相结合进行研究,如结合突变级数模型,继而从静动两个视角分析专利文献和科学文献对专利被引的影响[23]。其他方法包括ERG模型、决策树方法、技术共类分析等。决策树避免变量独立条件[40],ERG模型避免了独立性与分布假设的约束[65],在现有研究中的应用尚较少。

4 结论

本文系统梳理专利被引影响因素的相关研究,识别并归纳了三类共14个影响专利被引频次的因素:后向引用因素,包括后向引用文献数量、后向引用文献质量、引证深度以及引证广度;专利自身因素,包括时间、早期被引、IPC分类数、专利主题、权利要求数量、同族专利数量;专利产生因素,包括专利权人、合作、国家、资金。三类因素在对专利被引产生影响的同时彼此之间也存在相互作用,如学科领域的调节效应。针对同一影响因素在不同研究中效应不一致的现象,本文从法律规定对引用行为的影响、本土优势、后向引用文献类型、同族专利数量以及发明人数量五个角度进行了讨论。此外,还对研究方法进行归纳,指出采用被引频次衡量专利质量的争议,为专利被引影响因素的后续研究提供了借鉴和启示。

猜你喜欢

专利数量领域
专利
芳芳猜童话书的数量
2020 IT领域大事记
领域·对峙
专利文摘
统一数量再比较
头发的数量
新常态下推动多层次多领域依法治理初探
肯定与质疑:“慕课”在基础教育领域的应用