APP下载

从中外专利客体保护水平差异浅谈大数据领域客体审查规则调整①

2022-08-11赵小宁

专利代理 2022年2期
关键词:国家知识产权局客体预处理

刘 佳 赵小宁

一、引言

随着人类社会步入数据驱动的数字经济时代,数据要素进一步提升了全要素生产率。相应地,数据量呈指数级增长,以数据服务为主要业务的企业所处理的数据量可达PB 级,而全球每年所产生的数据量更是达到惊人的ZB 级②2021 大数据独角兽企业排行榜,互联网周刊,2021 年8 月5 日。。目前,大数据相关专利申请呈快速上涨趋势。现行《专利审查指南》(以下简称“指南”)中第九章第6 节虽然围绕人工智能、互联网+、大数据以及区块链等新领域新业态相关发明专利申请做出规定,但其中并未提供大数据领域有强针对性的审查基准和审查示例,审查员在该领域的审查实践中依然存在很多困惑,审查标准执行不一致的情形时有发生。同时,创新主体对完善大数据领域专利审查规则的需求非常迫切。

从指导案例和审查实践来看,大数据各个技术分支上欧、美、日、韩四局和中国国家知识产权局的客体保护水平有所差异,如何从典型案例中厘清不同技术分支上的客体保护水平的差异程度,以及据此给出操作性较强的客体审查规则的调整建议是亟待解决的问题。本文从欧、美、日、韩四局与中国国家知识产权局在大数据领域专利客体保护水平上的差异分析入手,基于大数据领域关键技术分支的典型案例分析,结合国内创新主体需求,尝试提出大数据领域客体审查规则的调整建议。

二、欧、美、日、韩四局与中国国家知识产权局在大数据领域专利客体保护水平上的差异

(一)欧、美、日、韩四局审查规则要点

欧、美、日、韩四局审查指南中均未设置针对大数据领域审查的章节,基于其软件相关客体审查标准与指导案例,四局在大数据领域审查标准要点如下。

1.EPO 审查规则要点

区分基于分类、聚类、回归和降维的计算模型和算法与计算模型以及算法在各种技术领域的具体应用和技术实施之间的区别,根据计算模型和算法是否涉及技术应用、技术实施,并用于技术目的来判断是否属于保护客体。

2.USPTO 审查规则要点

纯粹的收集信息和分析收集到的信息都是抽象构思,在收集分析信息的基础上,要增加特定的技术手段来解释如何应用分析后的信息并产生有益的技术效果,才符合专利客体适格性要求。对于利用计算机系统运行神经网络模型的方案,由于未引述司法例外,符合专利客体适格性要求。

3.JPO、KIPO 审查规则要点

KIPO 的专利法与审查指南早期从JPO 照搬,两者客体判断思路大致相同,都需判断是否为“利用了自然规律的技术构思”,以及是否为“软件的信息处理被具体地通过硬件资源实现”。另外,与USPTO 类似,两局认为限定了数据采集分析而未明确采集分析目的的方案不属于专利保护客体。

(二)大数据领域IP5 客体保护水平对比

IP5 中,EPO 的审查标准最为严格,从审查实践来看,USPTO、JPO、KIPO 审查标准大致相当。图1从数据采集、关联分析等八个维度对USPTO、JPO、KIPO 的客体保护水平进行了比较。

图1 国家知识产权局与美、日、韩在大数据领域的客体保护水平对比

中国国家知识产权局与USPTO、JPO、KIPO 相比,涉及数据采集、数据预处理的方案客体审查标准相对宽松;但是,国内创新主体对进一步放宽数据预处理的审查标准仍有诉求。国家知识产权局对涉及分类聚类、神经网络等通用分析算法以及用户协同过滤、知识图谱、社交网络等特定关联分析算法或模型的方案客体审查标准比USPTO 要严格得多,不利于基础算法技术创新。

三、大数据领域关键技术分支的典型案例分析

(一)涉及数据采集、数据预处理以及任务调度的典型案例

USPTO 指导性案例第40 号、第42 号分别涉及数据采集与数据预处理。在这两个分支上,USPTO的客体审查标准比中国国家知识产权局严格得多。另外,从美局审查实践来看,在任务调度这个分支上,也比中国国家知识产权局的客体审查标准严格。具体案例如下:

1.USPTO 指导性案例第40 号③https://www.uspto.gov/sites/default/files/documents/101_examples_37to42_20190107.pdf(2021 年8 月1 日最后访问)。

该方案请求保护一种通过网络中计算设备之间连接的网络设备来自适应监视流量数据的方法,包括:通过所述网络设备,收集与通过所述网络设备的网络流量相关的流量数据,所述流量数据包含网络延迟、数据包丢失或抖动中的至少一者;通过所述网络设备,将收集到的所述流量数据中的所述至少一者与预定义的阈值进行比较。

USPTO 认为,其他要素没有将该申请中抽象概念“将收集到的所述流量数据中的至少一者与预定义的阈值进行比较”转化成实际应用。其他要素有两个:通过所述网络设备,收集与通过所述网络设备的网络流量相关的流量数据,其中所述流量数据包含网络延迟、数据包丢失或抖动中的至少一者;通过所述网络设备实现比较步骤。但是,这些其他要素仅仅收集数据却没有根据收集到的数据提供一种特定的技术手段去解决特定的技术难题,相当于仅仅将该抽象构思应用于公知的计算机设备。因此,该方案不具备专利客体适格性。

2.USPTO 指导性案例第42 号④同注释③

该方案请求保护一种方法,包括:以标准格式将患者病情的信息储存在多个基于网络的非临时储存装置中,该储存装置存有医疗记录集;通过网络向用户提供远程访问,以便任何一个用户都可以通过图形用户界面实时更新在该医疗记录集中的有关该患者病情的信息,其中该用户以取决于该用户使用的硬件和软件平台的非标准格式来提供更新后的信息;和通过内容服务器将该非标准格式的更新后的信息转换为标准格式。

USPTO 认为,该方案仅仅涉及收集和更新患者信息,相当于将该抽象构思应用于公知的计算机设备,没有提供特定技术手段。因此,该方案不具备专利客体适格性。

3.关于任务调度的审查实践案例

一种集群中的任务执行方法,包括:获取待执行任务;根据所述待执行任务的指定属性,在预先划分的各集群资源集合中,确定所述待执行任务对应的集群资源集合;利用确定出的集群资源集合中包含的集群资源,执行所述待执行任务。

USPTO 认为,“根据所述待执行任务的指定属性,在预先划分的各集群资源集合中,确定所述待执行任务对应的集群资源集合”即思维过程,“确定”的步骤并不明确执行主体是谁,不排除人来执行上述步骤的可能,从而方案中涉及了思维过程这种司法例外;进一步地,也未将司法例外转换成实际应用,因此该方案不具备专利客体适格性。

而根据中国国家知识产权局的客体审查标准,上述三个案例均属于专利保护客体。根据中国国家知识产权局指南,这三个案例均处理的是技术领域中具有确切技术含义的数据,满足“三要素”的要求,均属于专利保护客体。

(二)涉及神经网络等通用数据挖掘分析算法的典型案例

在通用算法分支中,美、日、韩审查标准差异不大,均比中国国家知识产权局审查标准宽松。美局认可在计算机上运行通用算法模型类的方案为专利保护客体,这与中国国家知识产权局审查标准差异较大。以下两个案例为国内外业界均高度关注的USPTO 授权案例,专利权人为谷歌公司。

1.USPTO 授权案例1

一种计算机实现的方法,包括:获取多个训练样例;和在多个训练样例上训练具有多个层的神经网络,每个层包括一个或多个特征检测器,每个特征检测器具有一组对应的权重,以及特征检测器的子集在处理每个训练样例的过程中被禁用的概率,其中在多个训练样例上训练神经网络,对于每个训练样例分别包括:确定在训练样例的处理期间要禁用的一个或多个特征检测器,包括基于与特征检测器相关联的相应概率来确定是否禁用子集中的每个特征检测器,根据所述确定禁用一个或多个特征检测器,以及使用神经网络处理训练样例,并禁用一个或多个特征检测器,以生成训练样例的预测输出。

2.USPTO 授权案例2

一种由一个或多个计算机执行的方法,该方法包括:接收包括多个特征的输入,其中每个特征具有不同的特征类型;使用第一个机器学习模型处理输入以生成输入的第一个替代表征,其中第一个机器学习模型是具有单层线性计算的线性模型;使用深度网络处理所述输入,以生成所述输入的第二个替代表征,此处的深度神经网络是由多级非线性运算组成的第二个机器学习模型;使用logistic 回归分类器处理输入的第一个替代表征和第二个替代表征,以预测输入的标签。

3.USPTO 授权案例分析

USPTO 认为,上述授权案例的权利要求并未引述司法例外,其未引述任何数学关系、公式或计算,也没有引述思维过程,且没有引述任何组织人类活动的方法,因此,在step 2A 的第一阶段就可以直接认定上述权利要求具备专利客体适格性,从而无需进行后续步骤的判断。

另外,按照日本和韩国的审查标准,虽然当前权利要求可能不属于专利保护客体,但是仍然可以通过修改的方式克服专利保护客体的缺陷。例如,在权利要求中限定方法的各步骤由计算机硬件部件执行,从而体现出该方法由计算机硬件具体实现。

然而,根据中国国家知识产权局的审查标准,上述两个案例在本质上都是使用计算机来执行通用算法的改进,计算机在整个方案中只是起到了执行载体的作用,整体方案未解决技术问题,未采用技术手段,未获得技术效果,不属于专利保护客体。根据2021年指南修改征求意见稿,上述案例也不是目前拟“定向放开”的情形,方案中涉及的算法没有与计算机系统的内部结构存在特定技术关联,不能解决如何提升硬件运算效率或执行效果的技术问题。

(三)涉及用户协同过滤、知识图谱等特定数据挖掘分析算法的典型案例

涉及用户协同过滤、知识图谱等特定数据挖掘分析算法的,中国国家知识产权局审查标准相比于美、日、韩也更加严格。典型案例如下:

1.用户协调过滤算法相关案例

一种基于随机森林修正的大数据下改进协同过滤推荐方法:提取用户对每个物品的评分;建立当前用户特征向量集合,利用特征向量集合,为用户构造用户喜好随机森林分类模型;计算用户间相似度,寻找用户的k 个最近邻;计算改进协同过滤算法预测评分得到初步推荐列表,使用随机森林分类模型以对初步推荐列表分类,结合两种方法进行修正得到最终推荐列表。

2.知识图谱、社区网络相关案例

一种挖掘知识图谱的方法:根据社区用户的社区原始数据、所述社区用户的用户属性、所述社区用户属于的主题论坛或所述社区用户属于的即时通信工作的聊天群,对所述社区用户进行聚类并形成社区用户圈子,所述社区原始数据包括所述社区用户对其他社区用户的关注度信息和所述社区用户与所述其他社区用户共同关注的话题个数;根据所述社区用户圈子包括的社区用户产生的用户行为数据,创建所述社区用户圈子的知识图谱。

3.相关案例分析

从审查实践来看,美、日、韩对于上述两个案例类型通常不会质疑其客体问题,但中国国家知识产权局审查员对这类案例的观点存在较大分歧。对于协同过滤的案例,一种观点认为,权利要求中虽然提及了“获取电子商务网站的记录”以及“提取用户对每个物品的评分”,但其所解决的问题仅仅是协同过滤算法本身存在的问题,所要解决的问题、实现的效果仍然是优化算法方面的,而非技术方面的。对于涉及知识图谱、社区网络的案例,一种观点认为,该方法解决的问题为如何表达用户关系的精细度,并非技术问题,构建知识图谱所依据的社区用户之间的关联关系也不符合自然规律。根据上述观点,这两类案例并不属于专利保护客体。

四、大数据领域客体审查规则调整

基于前述中外专利客体保护水平差异以及国内创新主体的需求,我们建议对中国国家知识产权局大数据领域客体审查规则进行调整。

(一)关于数据预处理的客体审查规则建议

虽然当前中国国家知识产权局对于数据预处理分支的申请的客体判断标准比美局宽松,但是数据预处理与提升数据质量有直接关系,国内创新主体(例如京东集团等)对于进一步放开数据预处理客体审查标准仍有较强的诉求。因此,对于涉及利用具体的数据预处理手段来解决大数据的数据记录的完整性、一致性、唯一性、有效性、准确性等技术问题,并获得相应的技术效果的方案,建议将其认定为属于专利保护客体。但是,需要注意区分相关方案是纯粹的数据预处理算法还是大数据的数据记录处理方案。例如:方案“一种基于数据预先补全方法,包括:对输入的不完备数据矩阵求出其对应的正交映射算子来表示数据矩阵的对应项不为空的位置的集合;定义矩阵的Schatten Capped p 范数;求解最优化问题,直至收敛,输出补全的数据矩阵”是纯粹的数据预处理算法,而方案“一种数据预处理方法,包括:将待处理数据记录集分解到可以表达所述待处理数据记录集的至少一个特征上,以获得特征值;根据特征值及其权重,获得数据记录之间的相似度;利用所述相似度,填充所述存在缺失值的数据记录的缺失值”则是数据记录的处理方案。纯粹的数据预处理算法仍然是不能授予专利权的。

(二)关于通用算法的客体审查规则建议

美局授权的两件申请对业界的影响较大。虽然谷歌方认为,其提出专利申请的目的主要是为了防止谷歌研究人员的成果被其他机构申请专利后进行讹诈,进而引发经济损失,并明确表示其不会使用人工智能算法的专利来攻击其他公司,也不会用这部分专利来获利,但业界仍认为,专利制度的初衷是通过经济学手段来促进创新,防止创意被其他公司窃取或复制,但当下的趋势却是一些巨型公司利用专利实现技术垄断,并滥用专利制度所赋予它的权利,因此,应当重新思考算法这类抽象概念的专利申请是否应当被授权⑤量子位.被骂了三年,谷歌Dropout 专利还是生效了,卡脖子预警[EB/OL].(2019-06-27)[2021-09-27].https://mp.weixin.qq.com/s/MZf9RRumKolnxSuerpC3Q.。就中国研发现状而言,国内企业及科研机构较多的研发精力被放在了算法的应用上,而在基础算法方面起步较晚,尤其相对美国发展滞后。同时,国内大部分创新主体对于通用算法改进类的专利申请的客体审查规则的需求并不强烈。因此,在通用基础算法相关申请的客体放开的问题上,建议尽量谨慎对待。

另一方面,国内创新主体对于通用算法应用相关的申请,希望客体审查标准能进一步放开。例如,有些涉及通用算法应用的方案,其可在多领域应用,而并不局限于具体的某个领域。对这类申请,中国国家知识产权局目前的审查标准过于严格。即便是根据2021 年指南修改征求意见稿,国内创新主体的诉求也难以满足。

(三)关于用户协同过滤、知识图谱、社区网络等特定算法或模型的客体审查规则建议

用户协同过滤、知识图谱、社区网络等特定算法或模型通常是用于解决特定场景下的特定问题,自身能体现用户间、信息内容间或用户与信息内容间的语义关系与其他关联关系。这类算法或模型与分类聚类、神经网络等抽象程度高的通用算法在技术本质上有一定区别。在调整客体审查规则时,应当关注特定算法与通用算法的差异。另外,这类申请通常与图计算相关。图计算也是大数据领域的重点发展方向之一,从国内申请量变化来看,与社区网络、知识图谱相关的专利申请量逐年增加。对于基于互联网用户之间关联关系以及基于用户与互联网信息内容之间关联关系、信息内容之间的关联关系而进行数据处理的方案,提供数据服务行业的创新主体对其保护诉求强烈。适当放开关于该领域专利申请的客体审查标准,有利于鼓励该领域的技术创新,促进技术发展。

五、结语

本文针对大数据领域审查工作中存在的缺少强针对性客体审查规则的问题,对欧、美、日、韩四局审查规则要点进行梳理,并结合七个典型案例从数据采集、数据预处理、任务调度、神经网络等技术分支上分析了中外客体保护水平差异程度,进而针对数据预处理、通用算法、特定算法三个方面提出客体审查规则的调整建议。

专家点评

本文针对大数据领域审查实践中的客体保护问题,对比介绍和分析了五局在大数据不同技术分支下的客体保护标准的差异,并结合相关典型案例进行了举例说明。最后,结合国内创新主体诉求,针对大数据的数据预处理、通用及特定算法提供了具有针对性的客体审查规则调整方案,为大数据领域专利审查规则的不断完善提供了有价值的参考。

猜你喜欢

国家知识产权局客体预处理
社会公正分配客体维度与道德情绪的双向互动
KR预处理工艺参数对脱硫剂分散行为的影响
求解奇异线性系统的右预处理MINRES 方法
污泥预处理及其在硅酸盐制品中的运用
浅议犯罪客体
国家知识产权局老年大学学员作品欣赏
基于预处理MUSIC算法的分布式阵列DOA估计
An Invention Patent Application
第三届国家知识产权局人才工作会议召开
国家知识产权局规范性文件制定和管理办法草案公开征求意见