APP下载

欧洲专利局专利法律状态数据深加工的关键问题

2023-03-30雷孝平邢晓昭

科技管理研究 2023年4期
关键词:许可代码专利

雷孝平,桂 婕,邢晓昭

(中国科学技术信息研究所,北京 100038)

1 研究背景

知识经济时代,专利在全球竞争中的重要性日益凸现。随着对专利信息的深入挖掘和应用,专利状态动态变化的特征逐渐引起了研究人员的重视,如廖花林等[1]、甘绍宁[2]的研究指出,专利权随时间不断发展变化的信息均记录在专利法律状态中。蒋君等[3-4]指出,专利法律状态包含了专利权利的有效性、范围、归属等状态信息,是专利公报中的重要内容,它贯穿专利从诞生到消亡的整个生命历程,是专利(申请)权得以实施的法律依据,也是专利权人保护专利知识产权、实现技术转移的重要参考,并且能真实反映企业的技术研发能力、战略布局及市场竞争力等状况。

国内外学者对专利法律状态的相关研究主要集中在专利法律状态分析方法以及在各技术领域应用的实证研究。在理论研究方面,赖院根等[5]、杨长青[6]建立了专利法律状态信息分析框架以及多维专利法律状态数据分析模型。在实证研究方面,You等[7]、蒋君等[8]、郭颖等[9]基于专利法律状态信息,对疫苗、胰岛素、纳米等技术领域的专利质量或者技术转移状况等进行了探讨。已有相关研究主要是对专利法律状态数据的开发和利用,数据来源大多是商业数据库提供的深加工后的结构化法律状态数据,但是有关专利法律状态数据如何进行深加工方面的学术研究还比较少。此外,现有相关研究主要着眼于中国专利法律状态数据的加工,关注点在于如何对数据进行清理并构建法律状态规范体系,如蒋君等[3]、崔国振等[10]和黄俞翔等[11]的研究,缺少对国外专利法律状态数据深加工方面的研究,而侯晓艳等[12]、雷孝平等[13]的相关研究也仅对国外专利法律状态数据格式和内容进行介绍和结构解析,缺少对深加工关键问题的讨论。

欧洲专利局(European Patent Office,EPO)收录了全球100 多个国家和地区办事处的超过1.4 亿份专利文件数据,是目前世界上收集专利数据最多的政府间组织[14]。由于数据来源广泛,各国/地区专利数据涵盖内容和数据格式都有所不同,刘会景等[15]、陈学方等[16]的研究表明,EPO 对多源异构数据进行了处理和加工,形成标准格式的规范化XML 专利数据,解决了各专利数据库和文件之间分离和相互链接困难等问题。基于这些加工后的专利数据,EPO 提供了与第三方、世界知识产权组织(WIPO)和其他商业机构等进行数据交换的XML格式专利数据库,比如DOCDB 数据库和INPADOC数据库,前者记录了专利著录项等相关数据,后者记录了专利法律状态数据。对于这些规范化XML 数据,EPO 对外提供的服务有付费和免费两种方式,用户可以直接购买数据库,也可以通过EPO 开放专利服务(OPS)免费获取数据,但是OPS 服务下载的数据数量受限制[13]。虽然EPO 的专利法律状态XML 交换数据已经在原始数据基础上进行了初步处理加工,但是由于数据的复杂性和多样性,加工深度不够,用户很难对其进行解读和理解,无法直接用于专利检索和分析,因此需要对其进行深加工,处理为更利于用户理解和使用的数据。

为此,本研究以EPO 全球专利法律状态XML交换数据为基础,详细介绍其数据覆盖范围以及不同类型交换数据的数据格式,对专利法律状态分类体系构建、当前有效性判定、专利技术转移分类等关键问题进行深入研究,最后构建EPO 专利法律状态数据库物理模型,以期提高专利法律状态数据质量,提升专利数据检索和分析的易用性和准确性,为专利保护和转化提供参考。

2 EPO 专利法律状态数据状况

EPO 专利法律状态数据存储在INPADOC 数据库中,该数据库包含来自全球50 多个国家和地区的专利法律事件,包括专利公报中的法律事件以及包含欧洲专利局和世界知识产权组织在内的各国家/地区专利局登记册中的法律事件,中国也位列其中[17]。中国国家知识产权局早在1985 年就与欧洲专利局开展双边合作,2017 年将合作提升为全面战略伙伴关系,双方专利数据交换渠道畅通,法律状态数据更新及时[18]。

EPO 提供了多种专利法律状态数据产品,不同产品对应的数据内容基本相同,均来自INPADOC 数据库,但是不同产品提供的交换数据的格式不同。以INPADOC 每周交换的和开放专利服务提供的专利法律状态XML 数据为例,前者每周交换的文档中包含多件专利的全部法律事件信息,而后者提供单件专利的法律事件信息。除此之外,两种产品法律状态数据的数据结构也不相同:INPADOC 交换的法律状态XML 数据的法律事件内容包含在节点元素“legal-event”中,该元素内部包含了事件日期(event-date)、事件类别(event-class)、事件代码(event-code)、事件详细信息(event-details)等子元素;而OPS 法律状态XML 数据的法律事件内容包含在节点元素“legal”中,该元素内部包含了从L001EP 到L500EP 的多个法律事件标签,标签中记录了法律事件的各项内容[13]。虽然不同产品的数据交换格式不同,且在进行数据加工时的数据解析方式有所区别,但是专利法律事件的内容相同,在加工过程中所面对的关键问题也是相同的。

3 EPO 专利法律状态分类体系的构建

3.1 EPO 专利法律事件代码含义的确定

在EPO 提供的专利法律状态数据中,使用法律事件代码来对法律事件进行分类,由字母/数字组成。INPADOC 每周交换的数据文档的“事件代码”元素中记录了法律事件代码,OPS 数据则是把这些代码记录在标签L008EP 中。EPO 网站提供了每周更新的法律事件代码文件,该文件中包含了专利法律事件代码的官方机构(authority)、法律事件代码、法律事件类别等信息。截至2022 年4 月30 日,EPO最新的法律事件代码文件中提供的法律事件代码有4 264 个[19]。

EPO 法律事件代码文件中的法律事件代码是国家指定代码,是由各国/地区/组织的知识产权官方机构提交给欧洲专利局的,不同来源机构的同一个法律事件代码可能会代表不同含义,如表1 所示,因此,对于专利法律状态文档中出现的法律事件代码,需要在法律事件代码文件中结合官方机构和法律事件代码确定该代码的具体含义。同样地,对于同一种法律事件,不同国家/地区/组织提供的法律事件代码也会有所区别,需要在法律事件代码文件中根据法律事件代码含义来查找对应的法律事件代码。可见,法律事件代码的多来源和不一致性给专利法律事件的分类和数据深加工带来了很大的困难。

表1 相同法律事件代码的不同含义

3.2 INPADOC 分类体系

为了使专利法律状态数据更易于理解和使用,EPO 为法律事件创建了一套INPADOC 分类体系,使专利信息用户更容易理解法律事件数据的性质,并以有效的方式检索相关法律事件数据[20]。该分类体系包括两个层次:类别级别和详细结构级别,目前EPO 仅开发类别级别,详细结构级别尚未开发。类别级别是该分类体系的最高级别,仿照世界知识产权组织的ST.27 标准(以下简称“ST.27 标准”),使INPADOC 分类与该标准兼容。

INPADOC 分类体系包括21 个类别,范围从专利申请(A)到事件信息的更正和删除(Y)和涵盖尚未分类的事件代码(Z)。INPADOC 分类体系中类别的性质和区别与ST.27 标准不完全相同,并且不使用ST.27 的N 类1),而是分别将与ST.27 的N类相关内容涵盖在B 类和H 类中。INPADOC 分类体系(见表2)中描述了专利法律状态的分类方案,包括类别定义及其详细描述,还列出了属于各个类别的事件示例。

表2 INPADOC 分类体系

表2 (续)

3.3 EPO 专利法律状态分类体系的构建

INPADOC 分类体系把4 000 多种法律事件代码归类到21 个类别,大大降低了用户理解和使用法律状态数据的难度,但是这些分类在法律状态检索和分析方面的实用性仍然不足,需要进一步归纳。笔者通过调研国内外6 个知名专利检索分析平台(PatSnap、INNOGRAPHY、incoPat、SooPAT、万象云、佰腾网)发现,各平台专利检索和分析时所涉及到的法律状态分类都有所不同。整体来看,incoPat、万象云、佰腾网在专利检索时提供的法律状态分类比较完整,并对专利法律状态进行了有效性归纳。从表3 可以看到,这些平台的法律状态分类各有其自身特色,比如:PatSnap 提供了专利诉讼和复审无效信息;INNOGRAPHY 提供了家族诉讼和联合申请信息;PatSnap 和incoPat 提供了专利合作条约(PCT)专利状态信息,SooPAT、万象云和佰腾网提供了详细的专利放弃和撤回分类信息。由此可见,对于专利法律状态分类体系的构建,不仅学术研究较少,实践应用的侧重点也各有不同,法律状态分类比较分散和无序,尚未形成层次化、系统化的分类体系架构。

表3 若干知名专利检索分析平台的专利法律状态对比

总体来看,虽然上述各平台专利法律状态分类有所不同,但基本都会涉及专利是否授权、专利当前有效性这两个方面的信息,同时大多也会提供专利转让和/或专利许可等技术转移信息。在实践应用中,专利信息用户在专利检索和分析时也对这几个方面的分类有较多的应用。参考这些平台的法律状态分类状况,本研究把EPO 专利法律状态归纳为在审、授权、有效、失效、技术转移和其他六大类,在INPADOC 分类体系基础上构建EPO 专利法律状态分类体系(见表4)。其中,一级类目包含了在审、授权、有效、失效、技术转移和其他6 种类型,每种类型下面都有细分的二级类目,二级类目对应了INPADOC 分类体系中的21 个类别;同时,通过EPO 法律事件代码文件,把专利法律状态数据中的法律事件代码与21 个类别相对应。当专利法律事件发生时,首先可以通过EPO 法律事件代码文件把法律事件代码对应到二级类目,而后再将其对应到一级类目,以此将所有的专利法律事件与6 个一级类目一一对应。

表4 EPO 专利法律状态分类体系

表4 (续)

4 EPO 专利当前有效性判定

由于一项专利从申请到授权再到维持与运营以及最后失效的整个生命周期中会有多个法律事件存在,专利的有效性也一直在发生变化,因此需要对当前有效性进行判定。具体而言,专利申请之后处于在审状态,受到法律临时保护;专利被授权后,成为有效专利,获得法律的正式保护;而当专利因为各种原因失效后,不再受到法律保护。技术转移和其他法律事件则可能发生在专利申请后的任何一个阶段,不影响专利的有效性。因此,当前有效性一般包含在审、有效和失效3 种状态。

EPO 专利法律状态分类体系将专利法律事件归类到6 个一级类目,分析这些一级类目在专利生命周期中出现的位置,可以对专利当前法律状态的有效性进行判定。图1 展示了专利生命周期及不同时期发生的法律事件可能对应的专利有效性的变化。一般来说,专利提交申请后进入在审阶段,其中发明专利被授权后会进入有效期;而实用新型和外观专利没有实质审查,公开即授权,在公开后就进入有效期,专利保护期届满后失效。从提交专利申请到保护期满之间的任何时期都可能因为相关法律事件导致专利失效。专利技术转移和其他法律事项可以出现在专利全生命周期中,对专利当前有效性的判定不会产生任何影响。

图1 专利生命周期及其有效性

随着各种法律事项在专利生命周期中出现,在审或有效的专利可以转变为失效专利,失效专利也可以重新转变为在审或有效专利,因此,对于6 个一级类目,专利有效性的判定遵循以下优先级规则:(1)失效/有效/在审的优先级高于专利技术转移和其他。(2)失效、有效和在审3 个类目的优先级相同,以发生的时间早晚来定优先级,后期类目的优先级高于早期类目的优先级。比如:专利当前处于有效状态,如果发生了技术转移和其他事件,不影响当前的有效状态;如果发生了某些法律事件对应到失效类目,则专利的当前有效性应该更改为失效。基于专利生命周期,结合有效性判定的原则,可以对专利当前有效性的状态作出正确判断。

5 EPO 专利技术转移类别判定

专利技术转移是科技创新中的重要环节,可以有效地促进技术成果转向产业应用。在实践应用中,专利转让和专利许可是两种最重要的专利技术转移方式。其中,专利转让是指专利权人/申请人将其拥有的专利权/申请权有偿或者无偿转让给他人,从而使专利权属情况发生变更;专利许可是指专利权人/专利申请人以订立专利实施许可合同的方式许可他人在一定范围内使用其专利,并支付使用费的一种许可贸易。中国专利转让需要在专利行政部门登记备案,专利许可则暂无要求强制备案,是否备案不影响专利许可合同的有效性。专利技术转移可能发生在专利全生命周期的任何一个阶段,以授权后为主。

专利技术转移相关法律事件代码在INPADOC 分类体系21 个类别中主要归类到R 类和S 类,但R类中除了专利转让,还包含专利申请人/专利权人地址变更、发明人提名、新发明人的变更或增加、代理人变更以及其他事项等;而S 类中除了专利许可,还包含专利质押、抵押和留置、其他权利和法律执行方式的信息、相关专利公报等。因此,需要从专利法律事件代码文件中把专利转让和专利许可法律事件代码挑选出来进行标注,以便后续专利信息分析人员进行有价值的技术转移分析。从表5 可以看到,不同官方机构来源的专利技术转移相关法律事件代码、含义和数量均不相同,十分复杂。

表5 专利许可/转让法律事件代码及其含义示例

截至2022 年4 月30 日,4 000 多个EPO 法律事件代码中包含R 类代码312 个、S 类代码190 个,经过人工筛选,得到专利转让代码172 个、专利许可代码114 个。梳理后发现,这些专利转让代码和专利许可代码主要可以归纳为如表6所示的子类别。对专利转让和专利许可进行详细分类标引之后,便于专利信息分析人员对专利的技术转移状况进行深入分析,更直观有效地揭示隐藏在数据里面的技术成果应用状况,有助于促进专利技术转化,引导相关政策或管理制度的制定,促进经济发展。

表6 专利转让和专利许可法律事件子分类

6 EPO 专利法律状态数据库物理模型

对数据进行结构化解析和深加工,构建EPO 专利法律状态数据库物理模型(见图2),不同数据格式的专利数据在存储时略有差异,但总体模型是相似的。以OPS 服务提供的专利法律状态数据为例,该数据库所涉及的表格包括:专利法律状态文档信息表、专利法律状态事件基本信息表、专利法律状态事件前行信息表、专利法律状态事件详细信息表、专利授权信息表、INPADOC 分类体系类别列表、专利法律状态分类规范表、专利许可信息表和专利转让信息表[21]。其中,专利法律状态文档信息表中包含了多个专利法律状态文档的基本信息,每一行数据代表一个专利法律状态文档的基本信息,记录这些信息有助于进行数据关联和验证;专利法律状态事件基本信息表记录了专利法律状态事件的简要信息;专利法律状态事件前行信息表记录了法律状态事件的主要文字描述内容,为非结构化文本;专利法律状态事件详细信息表记录了专利法律状态事件的详细信息,为结构化文本;INPADOC 分类体系类别列表是在EPO 法律事件代码文件的基础上,结合对EPO 专利技术转移类别的判定增加了技术转移标记,方便后续进行专利转让和专利许可分析;专利法律状态分类规范表中记录了前述EPO 专利法律状态分类体系;专利许可信息表和专利转让信息表中分别记录了专利许可和转让的详细信息。另外,在EPO 提供的专利数据中,主库是DOCDB 数据库,其中存储了专利著录项以及专利优先权、专利家族、专利引文等基本信息,专利法律状态数据通过D0CDB专利唯一标识符与主库中的专利基本信息相关联。D0CDB 专利唯一标识符是专利的身份标识,唯一代表一件专利,由D0CDB 数据库定义。当专利法律状态数据入库时,需要通过D0CDB 专利唯一标识符在专利基本信息表中添加与法律状态相关的数据字段,比如是否授权、当然法律状态、许可频次、转让频次等,这些数据将随着专利法律状态的变化进行动态更新,方便专利信息用户进行检索和统计分析。

图2 EPO 专利法律状态数据库物理模型示意

7 结论

由于EPO 提供的全球专利XML 交换数据覆盖的范围广、格式标准规范、更新及时、价格相对合理,目前已成为多家商业专利数据平台以及有专利数据加工需求的机构的主要购买来源,但是因为专利法律状态数据内容不仅动态更新,而且十分复杂,加工思路和流程难以厘清,存在很多关键问题难以解决,导致专利法律状态数据深加工已经成为专利数据加工中的难题。本研究详细介绍了EPO 专利法律状态数据的覆盖范围及数据格式,面向实际需求,构建了专利法律状态三级分类体系,明确了结合专利生命周期进行专利当前有效性判定的方法,对专利技术转移中专利转让和专利许可法律事件代码进行了分类判定和归纳总结,并在此基础上构建了EPO 专利法律状态数据库物理模型,为EPO 全球专利法律状态数据深加工提供参考,以期提高专利检索和分析工作的质量和效率。当然,由于专利法律状态数据是不断发展变化的,数据加工中的难题也会发生变化,数据加工思路和方法仍需要不断进行完善。

注释:

1)ST.27 标准的N 类代表“权利终结信息”。该类别是为了可救济性的权利终结而设计的,此类权利可以通过修改而“起死回生”。这一特性使其不适用于INPADOC 数据库。

猜你喜欢

许可代码专利
专利
版权许可声明
版权许可声明
版权许可声明
本期作者介绍
发明与专利
创世代码
创世代码
创世代码
创世代码