APP下载

专利信息智能辅助检索系统自动检索的人工干预

2020-06-07吴娜刘超

河南科技 2020年21期

吴娜 刘超

摘要:专利信息智能辅助检索系统中的自动检索以语义检索为特点,对所推选出的结果进行相关度排序,利用该模式下的文本检索、干预检索和推荐导航三个模块,可对自动检索结果进行人工干预,提升检索效率。本文结合实际案例的检索过程,探讨了人工干预对自动检索结果的影响,以及检索中进行人工干预的具体策略。

关键词:自动检索;人工干预;文本检索;干预检索;推荐导航

中图分类号:G354.2文献标识码:A 文章编号:1003-5168(2020)21-00087-03

1 引言

专利信息智能辅助检索系统是国家知识产权局在人工智能信息检索方面探索的重要成果[1],为坚决打赢这场提质增效攻坚战起到了重要作用。

本文基于实际案例,旨在分享使用专利信息智能辅助检索系统(以下简称“智能辅助检索系统”)的相关经验。

2 智能辅助检索系统中的自动检索及人工干预

专利信息智能辅助检索系统是基于专利信息智能语义检索系统进行的智能化改造项目。目前系统提供了智能信息推送、导引检索、智能检索、自动检索和相似度浏览五大功能模块,实现了专利信息智能语义检索系统从传统检索模式的工具性被动调用向智能化检索模式的主动推送的转变。

其中,自动检索是指系统根据案卷信息,通过后台算法自动检索结果集,并将结果按照相似度进行排序。

自动检索是一种全文语义检索模式,其根据技术方案中词条相互之间词义上的关系,对词条的集合进行处理,自动抽取语义形成关键词[2],并加工成N维空间内的一个向量,检索时计算各文献所形成向量的向量内积得到语义相关度。这种检索模式存在检索范围大、不能有效提取发明构思、无法使用精确分类[3]等缺陷,因此,仅仅采用基于申请号的自动检索在某些情况下并不能快速高效地获得最优对比文件,此时往往需要适当的人工干预,以改善上述不足。

人工干预是在系统中检索时,将语义检索命令与关键词和/或分类号等,采用布尔算符构建成检索式进行检索,使用者可以自己调整关键词或分类号等信息[2]。自动检索模式下,还具有文本检索、干预检索和推荐导航三个模块,其为人工干预提供了很好的途径。

3 具体案例分析

基于申请号的自动检索在某些情况下并不能快速高效的获得最优对比文件,而文本检索可根据输入的文本进行更有针对性的检索,干预检索可对基于申请号的自动检索结果进行干预,推荐导航可进一步扩展分类号,那将文本检索、干预检索和推荐导航与自动检索进行结合,又会对检索结果带来哪些影响呢,本文通过具体的案例进行展示。

3.1 人工干预提高检索效率

发明名称:氯氧镁涂层钢筋混凝土及其制备方法

常温下,用改性环氧树脂涂层均匀的涂覆在钢筋表面。

当仅基于申请号对该专利申请进行自动检索时发现:在没有干扰,仅看现有技术的情况下,可作为对比文件1的目标文件排在第47位,相似度为57%。

当利用干预检索进行干预时,在干预检索中加入“防腐”这个关键词,即用“防腐”这个关键词去干预基于申请号的自动检索结果集,同样在仅看现有技术的情况下发现,可作为对比文件1的目标文件排在第2位,相似度上升为92%。

当利用文本检索模块将权利要求1的内容导入文本检索框后进行检索,同样在仅看现有技术的情况下,发现可作为对比文件1的目标文件排在第2位,相似度上升为88%。

通过利用干预检索和文本检索后发现,目标文件的排序均向前提升,相较于仅仅基于申请号的自动检索,能更快地获得对比文件。基于申请号的自动检索是一种完全自动的检索模式,可作为智能检索的初探;而干预检索通过其输入的关键词和/或分类号对自动检索结果进行干预,在一定程度上可以理解为一种自动检索+干预的检索模式,在干预检索时,添加有效的关键词和/或分类号,会明显提升检索效率,同时其相对于传统的检索方式,不需用户构建检索式,更加快捷、简便。相较于自动检索和干预检索,文本检索是基于输入的新的文本进行语义检索,其可以理解为一种半自动的检索模式,用户可根据具体案情对技术方案、技术特征、技术问题和技术效果进行重点检索,结合使用分类号,检索结果更优。

3.2 利用文本检索可快速获取准确分类号

经前述介绍可知,推荐导航中的技术领域统计功能可帮助获取分类号信息,同时其统计结果根据检索对象的变化而变化。检索实践发现,基于申请号的自动检索存在领域扩展不足的问题。而相较于基于申请号的自动检索,文本检索可进行更有针对性的检索,对领域扩展不足的问题进行弥补。

在上述案例中,其权利要求1技术方案中记载了“步骤三:常温下,用改性环氧树脂涂层均匀的涂覆在钢筋表面”,而所检索到的对比文件1所用的涂层材料为久美特涂层,且是高温涂覆,现针对于上述内容,需要继续检索。

在没有干扰,仅仅基于申请号对该专利申请进行自动检索的情况下,发现没有可作为给出启示的对比文件2的目标文件。而利用干预检索加入关键词“防腐”及“环氧树脂”对基于申请号的自动检索结果进行干预,也没找到所需目标文件。通过分析发现,基于申请号自动检索结果多侧重于与主题名称相关的文献,这可能也是基于案卷信息自動检索领域扩展不尽完美的地方。这就提醒使用者根据检索结果以及发明点,适时调整检索方向。

针对本案例,通过分析原始文件所给分类号以及自动检索结果所涉及分类号可知,其检索的领域侧重于混凝土——C04B,与钢筋防腐不直接相关,且未扩展到与改性环氧树脂涂层相关的信息。干预检索时虽加入了“环氧树脂”这个关键词,但是从所得文献技术领域统计结果来看,其相较于自动检索的结果,变化不大。这就进一步提醒用户要根据技术领域统计结果,适时调整检索方向。

基于此可知,获取该案例对比文件2的关键是突破领域限制,获取有效分类号。

而文本检索是根据文本内容进行的检索,其检索对象是由输入的文本内容确定的。此时,可借助文本检索来扩展分类号,以弥补本案例自动检索领域扩展不足的问题。

对于该案例,所寻找的目标文件其侧重点在于用改性环氧树脂涂层涂覆在钢筋表面来防腐,因而,在利用文本检索获取分类号时,其输入的文本应是涉及改性环氧树脂的有效文本。在具体操作时,考虑到权利要求3的附加技术特征对改性环氧树脂涂层的具体组分进行了重点描述,同时说明书技术方案中可准确提取所需目标文件的相关关键词,因而采用在文本框中输入“权利要求3的附加技术特征+干预关键词:混凝土,钢筋,防腐,腐蚀,室温,常温,固化”的方法,进行检索后借助推荐导航中的技术领域统计功能确定与改性环氧树脂相关的分类号。

通过上述方法找到了“C09D163/00”这个分类号,其表示基于环氧树脂的涂料组合物,基于环氧树脂衍生物的涂料组合物,是与改性环氧树脂相关的准确分类号。分析发现:相较于在专利信息智能语义检索系统中通过/mems/ic命令统计分析来扩展分类号的方法,利用文本检索与推荐导航相结合的方法来扩展分类号,不用通过布尔运算构建检索式,更加方便、快捷。

随后,通过利用干预检索输入分类号“C09D163/00”及关键词“环氧树脂、钢筋、室温、常温”对基于原始案卷信息的自动检索结果进行干预,在给出文献的第4位便找到了给出启示的目标文件,相似度为75%。

3.3 合理编辑文本,提高文本检索效率

文本检索利用其文本框中文本可编辑的特点结合分类号可进行更有针对性的检索,合理编辑文本,对提高检索效率,获得更准确的目标文件起到了举足轻重的作用。

本文针对该案例,通过在文本检索的基础上加入分类号“C09D163/00”进行检索,以对文本编辑问题进行以下尝试:

首先,由于该案例所寻找对比文件2其侧重点应在于用改性环氧树脂涂层涂覆在钢筋表面来防腐,其申请文件的摘要从技术手段、技术问题、技术效果等方面对该关键技术手段进行了描述,能较准备表达所需目标文件信息。因而首先通过在文本框中输入摘要及关键词“混凝土,钢筋,防腐,腐蚀,室温,常温,固化,环氧树脂”,同时在分类号过滤栏中输入分类号“C09D163/00”,但是,本文未找到给出结合启示的目标文件。

随后,考虑到智能检索其实质是从文献中提取关键词并构成N维空间的向量,与其他文献的N维空间向量计算向量内积得到语义相关度的模式,本文采取直接提取关键词的方法在文本框中输入“混凝土,钢筋,防腐,腐蚀,室温,常温,固化,环氧树脂”进行检索,同时输入分类号“C09D163/00”进行限定,本文在给出文献列表的第29位找到了给出启示的目标文件,相似度为68.65%。

通过上述的检索过程,本文发现,在利用文本检索进行针对性检索时,直接输入能准确表达发明点的关键词比输入整段文本具有更高的效率。分析原因:直接提取关键词输入文本框中,相较于输入相关语段,可避免在检索过程中因关键词提取不准确或者不适当而带来的误差,降低了无关信息对检索结果的干扰。

4 结语

专利信息智能辅助检索系统是提高检索效率的有力武器,而自动检索无疑是智能辅助检索系统中最方便、最高效、最易上手的模块。在利用自动检索的同时,借助其文本检索、干预检索和推荐导航三个功能,可更快锁定目标文件。其中,干预检索可通过输入分类号或关键词对自动检索结果进行干预,文本检索可通过在文本框中输入编辑后的文字,并配合分类号进行检索,干预检索和文本检索均能更好的弥补自动检索领域扩展不足的问题。而准确添加文本内容,可以提高文本检索的效率;合理利用推荐导航中的技术领域统计功能,可帮助用户进一步扩展分类号。

参考文献:

[1] 杨宏章,付静.利用专利文本結构化特征构建专利信息智能语义检索系统的方法[J].情报理论与实践,2015(4):98、136-138.

[2] 郭嘉,史凯.浅析在PATENTICS检索系统中的专利检索应用[J].审查实践与研究,2017(8):123-127.

[3] 丁冉.PATENTICS的不同干预方式在电路领域中的检索应用[J].科技创新与应用,2019(23):180-181、184.