APP下载

基于技术多样性的专利申请人与审查员的引证行为差异

2019-01-21乔亚丽汪雪锋侯雨佳黄颖杨雪梅

关键词:审查员测度专利申请

乔亚丽,汪雪锋,侯雨佳,黄颖,杨雪梅

(北京理工大学 管理与经济学院,北京 100081)

专利文献是集技术、法律和经济情报于一体的知识宝库,是科技信息的重要载体。其中,专利引用信息能由表及里地揭示出科学技术间的相互关联及其发展规律[1]148,因此一直受到学术界的广泛关注和使用。近年来,专利引用在使用的过程中不断发展和完善,为更好地计量,学者们相继提出一些关于专利引用的测度指标,在最初简单统计专利被引数量的基础上,补充发展了专利共被引分析、专利耦合分析、专利自引和专利间接引用等指标。同时,专利引用也常被用来衡量专利价值、专利影响力,以及国家、机构等的研发能力和创新能力。专利引用在未来的科学研究中,仍将继续作为技术信息的重要载体,在科技评估、科技预测等活动中占据重要地位。

专利引用通常分为专利申请人引用和专利审查员引用。由于施引主体的立场和引用动机不同,导致这两类引文所承载和传递的信息存在较大差异[2]。专利申请人引用主要是专利申请人在提出申请时,列出相关先前专利或公开文献来说明其发明的技术背景,通过指出先前引用专利存在的“问题”或“局限”来表达自身技术的新颖性和创造性[3]。而审查员在审理过程中通常会先检索其认为与某申请专利相关的若干先前专利和文献作为对比文件,以此来判断该专利申请是否符合新颖性。因此,审查员引用更与其自身研究领域相关。

考虑到审查员引用具有一定的倾向性,学术界对于是否使用审查员引用专利数据也一直存在较大争议[4]。Jaffe等(1993)指出,在使用引用数据表征知识溢出时应将审查员引用数据作为“噪音”数据剔除,因为有时审查员引用专利并不能反映实际的专利发明人之间的知识流动[5]。同样地,Alcacer(2006)从自引、地理距离、技术重叠和年份等维度对申请人和审查员引用分布对比分析发现,使用申请人和审查员两者合并的引用数据推断发明人的知识水平可能会导致结果偏差或夸大的显著性水平[6]。Criscuolo等(2008)用计量经济学模型探究专利被申请人或审查员引用的驱动因素时,建议仅使用申请人引用数据作为知识流动的指示值[7]。

鉴于此,国内外学者从多个角度对申请人引用和审查员引用进行了对比研究。王兴旺等(2011)从发明人与审查员自身专业的角度对两种引文进行了对比,说明了专利审查员引文的重要性[1]148-150。肖冬梅(2015)则在审查员法定职责的基础上,从审查员引文格式的规范性、可获得性与数量优势等来进行探究,指出审查员引文在专利诉讼、知识交流、专利影响力及潜在竞争关系挖掘等方面存在重要价值[8]。国外相关研究对专利申请人和审查员引用数量的影响因素做了多方面分析,发现国家经济、国外公司、技术领域、技术经济结构及商业研发资金等因素会影响申请人和审查员引用的数量[9-11]。Thompsori(2006)通过统计对比目标专利及其引用专利中专利权人及发明人的地理位置,从知识溢出的角度说明了申请人比审查员更倾向于引用本国/地区的专利知识[12]。Hegde等(2009)则将引用专利数据与其未来是否更新数据相结合来评价专利的私有价值,发现审查员引用专利在未来更新的可能性更高、价值更大,从而说明审查员引用专利比申请人引用专利能更好地预测专利价值[13]。

由此可知,关于申请人引用与审查员引用的对比研究中,主要集中在地理位置层面的知识溢出、两种引用专利的价值比较及引用数量差异的影响因素等方面。随着专利数据挖掘的深入,学者们越来越多地集中于研究技术领域间的引用及其产生的知识传递与扩散,如基于专利引用的技术路径研究、技术会聚及技术扩散研究等[14-15]。那么,专利申请人引用与审查员引用在技术领域层面存在怎样的差异性?二者在技术领域层面是否具有一致性?Pachys等(2012)对比发现,审查员引用和申请人引用专利涉及的主要IPC4数量存在差异[16]。Park等(2017)利用HHI指数对专利审查员和申请人引用技术类别的集中度进行了测度,发现不同技术领域两种引用专利集中度呈现出差异性[17]。显然,目前关于技术领域间专利引用数据的对比研究,还停留在较为浅显的统计层面。缺少对申请人和审查员引用的技术分布差异性的深入探讨,没有考虑到技术间本身的差异性。因此,本文将引入技术类别间的差异度,从技术类别多样性视角出发,在技术类别分布基础上,对申请人和审查员引用的技术类别间知识流动情况进行深入挖掘,并进一步对申请人引用和审查员引用差异的相关性进行分析。

一、引用技术类别多样性测度

测度引用专利技术类别的多样性能更清晰地展示引用专利所在技术类别的分布情况,某一技术类别所引用专利常被用来当作知识流动过程中流入该技术类别的载体,因此,通过测度该技术类别引用专利的技术多样性可以很好地测度该技术类别的知识流入情况。对于多样性的测度目前大多集中于对科技文献的研究,为学科的多样性测度奠定了坚实的理论基础。

国际专利分类体系(International Patent Classification System,IPC)可用来表征专利的技术信息,但其分类数量较多,且IPC分类间界限并不是很明确、相似度较高,不便于进行比较研究。Schmoch等(2003)在前人研究基础上,将国际专利分类基于IPC前4位(简称IPC4)划分为44个技术类别,将专利和经济活动有效衔接起来,实现了技术和产业的对接,具有国际适用性[18]。随着国际专利分类体系的发展,随着部分IPC4的产生和消亡,导致部分IPC4无法全部与44个技术类别相匹配,为此本文将匹配不上的IPC4划分为Others。本文将基于上述44个技术类别分类,在技术类别分布分析基础上,对被引专利申请人引用技术类别多样性和审查员引用技术类别多样性进行深入分析,并进一步对比申请人引用和审查员引用的技术类别知识流入情况。

Shannon等在进行多样性测度时,只考虑了领域的丰富度(Variety)和均匀度(Balance),忽略了领域间自身的差异性(Disparity)[19]708-709。Stirling(2007)在前人研究基础上,将领域间自身的差异性引入多样性概念中,进一步丰富和完善了多样性测度指标,提出了适用于科学、技术和社会领域的多样性测度体系。该方法主要从3个维度考虑多样性测度:丰富度(Variety),即学科的数量;均匀度(Balance),即学科的分布均匀程度;差异度(Disparity),即学科性质的差异程度。涉及较多数量的学科、学科间分布的高度均匀性以及学科间自身较大的差异性均会使多样性指标的值更大[19]709-716。本文采用Rao-Stirling多样性指标作为被引专利技术类别多样性测度指标

其中,pi表示专利技术分类IPC4的共现矩阵中类别i占引用专利的比例;pj表示引用专利技术分类IPC4的共现矩阵中类别j占引用专利的比例;Sij表示技术分类i和j的相似度,基于将IPC4技术领域i和j的交叉引用频次标准化后的结果计算。RD的值越大,说明被引专利所属技术类别的多样性越高。

二、申请人和审查员引用的技术类别差异

专利申请人引用和审查员引用的区分并不是伴随着专利活动的产生而产生的,美国专利商标局(US Patent and Trade Office,USPTO)自2001年1月起才开始在授权专利扉页的著录项中标记区分专利申请人引文和审查员引文,相应地,USPTO数据库也从2001年起开始将专利申请人引用和审查员引用区分开来,以供管理人员和研究人员参考使用。鉴于美国专利对于申请人引用和审查员引用的可操作性,同时考虑到专利数量的适中性,本文随机选取USPTO专利数据库中2007年9月份的专利数据作为研究对象,总共获得目标专利13 621条,其中审查员引用专利114 075条,申请人引用专利291 221条。根据IPC4与工业技术类别的对照表,可以发现所有目标专利数据共涉及43个技术类别,显示出案例数据具有较强的代表性。

(一)专利引证信息整体行为差异

各技术类别对应的申请人引用和审查员引用的专利数量分布情况如图1所示,图1中43个节点分别代表目标专利所属的43个技术类别,横坐标表示所属技术类别专利的审查员引用的专利数量,纵坐标表示所属技术类别专利的申请人引用的专利数量,节点大小代表目标专利数量的多少。由图1可知,各技术类别申请人引用专利数量普遍高于审查员引用专利数量,其中医用器材 (Medical equipment,MEEQ),制药领域(Pharmaceuticals,PHAR)最显著。整体来看,各申请人引用与审查员引用数量比例基本一致,办公机械和计算机技术类别(Office machinery and computers,OMCO)申请人引用和审查员引用数量远高于其他技术类别,体现出其强大的专利申请规模,其次是信号传输和电信技术类别(Signal transmission,telecommunications,STTE)。

图2分别为目标专利、申请人引用专利和审查员引用专利所属技术类别的共现图,图2中节点大小代表某一技术类别专利数量的相对多少。由图2可知,办公机械和计算机(Office machinery and computers)、信号传输和电信 (Signal transmission,telecommunications)、 电子元器件 (Electronic components)、 测量仪器(Measuring instruments)等技术类别的目标专利数量较多,而申请人引用专利和审查员引用专利的技术类别分布基本上同目标专利相一致,呈现较为明显的相似性。

专利引用在一定程度上反映专利中知识的流动情况,源于知识背景和引用目的的不同,申请人引用和审查员引用的技术类别分布呈现出较大差异。统计分析发现,申请人引用专利所涉及的技术类别比审查员引用专利所涉及的技术类别数量更多,在一定程度上说明申请人引用专利的知识类别更广。大部分技术类别的专利知识来源中,审查员更集中于对本类别知识的引用,申请人关注的知识类别则更加全面,与其涉及技术类别较广的结论相一致。

图1 专利引用数量分布图

图2 专利技术类别共现图

为更直观地呈现基于申请人引用和基于审查员引用的各技术类别间的知识流动情况,本文利用Gephi软件分别对各技术类别的专利申请人引用数据和专利审查员引用数据绘制技术类别的知识流动图(图3、图4),节点代表技术类别,其中中间两列代表引用专利的技术类别,两侧代表目标专利的技术类别,相同技术类别处于同一行,节点大小代表技术类别涉及频数的相对多少,连线粗细代表知识流动的强弱,线越粗,说明知识流动强度越高,箭头表示知识的流向,即从知识提供方流向知识接收方。可以看到,在申请人引用的知识流动图中,只有制药(Pharmaceuticals)等少数技术类别知识集中流向本技术类别,而在审查员引用的知识流动图中,办公机械和计算机(Office machinery and computers)、信号传输和电信(Signal transmission,telecommunications)、制药(Pharmaceuticals)、电子元器件(Electronic components)、测量仪器(Measuring instruments)、机动车(Motor vehicles)等大部分技术类别知识集中流向本技术类别,说明审查员引用的知识更多集中于本技术领域,与审查员引用不同的是,申请人引用的知识较为分散,涉及的技术领域更广。

图3 申请人引用知识流动图

图4 审查员引用知识流动图

(二)专利引证信息的多样性行为差异分析

专利的技术类别分布可以简单地反映专利申请人引用和审查员引用的技术类别分布情况,但只是停留在较为浅显的层面,忽略了技术类别间本身的差异性。专利引用所属技术类别的多样性测度则将技术类别间自身的差异性同引用专利技术类别的数量、技术类别分布的均匀性有机结合起来,从3个维度对知识流入情况进行更加全面、细致的测度。图5显示了43个技术类别的申请人引用多样性和审查员引用多样性的测度指标值,节点分别对应43个技术类别。很显然,在大多数目标专利技术类别中,申请人引用专利所属技术类别多样性高于审查员引用,进一步说明申请人引用知识来源多样性更高,知识流入分布范围更广,审查员引用的知识所属类别则相对集中,知识来源分布于少数几个技术类别。特别地,部分技术类别申请人引用多样性与审查员引用多样性差异十分显著,如油漆和清漆(Paints,varnishes)类别中申请人引用多样性较高,而信号传输和电信(Signal transmission,telecommunications)、穿着服饰(Wearing apparel)类别中审查员引用多样性较高。

无论是在技术类别分布还是在技术类别多样性分析中,审查员引用和申请人引用都呈现出较大差异。从技术类别分布和技术类别多样性两个维度分别对申请人引用和审查员引用进行相关性分析(如表1所示),结果表明,申请人引用和审查员引用均呈现出较为显著的正相关性,说明在各技术类别中申请人引用和审查员引用并不是互斥的,而是互为补充。

图5 申请人引用和审查员引用专利所属技术领域多样性

表1 申请人引用和审查员引用的相关性分析

三、结论与讨论

在基于专利引用的知识流动过程中,申请人引用和审查员引用发挥着不同的作用,存在明显的引用行为差异。本文在技术类别分布分析的基础上,引入技术类别多样性对申请人引用和审查员引用在技术领域间的行为差异进行了深入研究。就单个技术类别的知识流入情况来看,申请人引用的知识来源覆盖类别更广,知识会聚吸收能力更强,而审查员引用则更集中于本技术类别及少数几个相关性较强的技术类别,这与专利审查员引文本身的特点相关,即基于审查员对其所在技术领域的深刻经验基础上的相关性检索[20]。与先前研究中“专利审查员引文具有的跨学科、跨领域优势”明显不同[1]149-150。从被引专利所属技术类别的多样性角度来看,大多数技术类别的知识来源中,申请人引用专利的技术类别多样性更高,进一步说明了申请人引用的知识覆盖面更广。相关性分析结果表明,从整体来看,不同技术类别中申请人引用和审查员引用具有显著的正相关性,互为补充作用。

本文提出将技术类别间自身的差异性引入专利申请人引用和审查员引用的对比研究中,补充了以往研究中仅考虑数量分布的不足,对申请人引用和审查员引用技术类别的研究提供了一个新的思路。本文研究结果表明,虽然申请人引用与审查员引用存在较大差异,但两者的测度指标均呈正相关关系,基本保持一致趋势,且审查员更集中于本技术类别的引用,体现了审查员法定职责的强制性使得审查员引文与其审查专利之间存在较高的技术相关性,进一步说明审查员引用在技术领域间知识流动的研究中并不是作为“噪音”而存在,这一结论对未来技术领域间知识流动、知识扩散等研究及其引用数据的使用提供参考。

本文研究也存在一些不足,由于每项专利的IPC数量存在差异,样本数据的选择具有一定主观性,均可能会对结果产生一定影响。在未来研究中,还需要选择跨度较大的时间窗口,对申请人引用和审查员引用差异的规律性进行更深入的研究。在技术类别方面,需要进一步考虑不同技术类别的特征,以期对各技术领域提供更加精细化的建议。

猜你喜欢

审查员测度专利申请
从一件无效宣告请求案谈专利申请过程中的几点启示和建议
局部紧的阿贝尔群上谱测度的几何结构
Rn上的测度双K-框架
我国要素价格扭曲程度的测度
浅析基于博弈论视角下专利审查员与代理人间的意见分歧及弱化措施
提升专利质量,树优质审查作风
2018年河南省各省辖市及直管县(市)专利申请量统计表(1月)
2017年河南省各省辖市及直管县(市)专利申请量统计表(12月)
韩国AI内容专利申请数5年激增10倍
新加坡启动专利审查非正式沟通渠道