APP下载

基于大数据视角的企业专利风险预警研究

2021-01-03周胜生

情报杂志 2021年10期
关键词:卡脖子预警专利

李 莹 周胜生

(1.国家知识产权局专利局专利审查协作天津中心 天津 300304;2.天津大学管理与经济学部 天津 300001)

0 引 言

近年来,中美贸易战愈演愈烈,美国对华企业接二连三的“卡脖子”行为比比皆是,印证了知识产权在产业竞争中的巨大影响力足以左右国与国之间的科技博弈。专利可以代表企业创新实力和核心竞争力,也是包含了丰富的技术信息、法律信息和市场信息的情报载体。中兴和华为产品供应链风险早在2016年QUESTEL发布的《芯片行业专利分析及专利组合质量评估报告》中已初现端倪[1],芯片产业链的核心技术专利均掌握在发达国家手里,潜在的供应链风险随时发生,因此通过从专利角度预测企业风险,具有现实意义。

2020年12月世界知识产权组织发布的《世界知识产权指标2020(World Intellectual Property Indicaters 2020)》[2]指出,2019年全球专利申请量超过320万件,中国连续多年专利申请量世界排名第一。面对如此庞大的数据,我国企业如何高效的利用专利数据,充分挖掘专利情报为我国企业提供预警信息成为目前专利工作者急需解决的问题。

利用专利信息帮助企业进行风险防控通常包括两种方式,一是从技术情报角度进行技术风险识别,例如技术产业化风险、技术原创性的风险,常用的企业经营场景包括新技术引进、技术转移等;二是利用专利的排他属性进行侵权风险识别和处理[3]。但是,目前专利情报分析缺乏有效的数据处理手段,普遍存在人工成本高、效率低等问题。大数据技术可以将隐含的、有噪声的数据建立高度关联性,有学者将大数据技术与专利分析高度融合,提高了专利分析的效率[4]。大数据技术用于风险预测可以提高风险预警准确性和科学性[5-7]。但是,现有文献鲜有利用大数据方法进行企业专利风险预警的相关研究。基于此,如何使大数据处理方法与企业专利风险预警高度融合,使专利预警更高效、预警内容更全面,是本文要讨论的问题。本文积极运用大数据方法分析企业专利风险预警研究,构建了科学合理的企业风险预警体系,完善了企业专利风险预警理论,同时,拓宽了大数据分析的应用领域,对于有效防范企业风险、促进企业发展具有重要意义。

1 专利预警研究现状

1.1专利预警项目一般流程专利预警是专利情报分析的重要内容,通过对专利态势、技术的梳理,系统的监测专利布局情况,从不同层面识别风险。结合专利预警工作实际,将专利预警项目实施流程分为四个阶段:前期准备阶段,与企业进行需求对接,经过充分调研,确定分析目标;了解企业关注的技术或产品市场发展情况,明确技术边界,进行专利检索和数据处理;选择适宜的专利分析工具和方法进行企业风险预警;最后撰写专利预警报告,制定风险应对策略以及成果展示。

1.2专利预警国内外研究现状为了全面了解专利预警研究现状,采用文献计量法对专利预警领域近10年文献进行统计,通过设置关键词“专利预警”“专利风险预警”“专利风险分析”“知识产权风险”,在中国知网和Web of Science,检索到相关文献进行研读、归类和分析,主题词包括知识产权及风险、专利预警及机制、风险防范、风险评估及应对策略、法律风险、风险识别。通过对相关文献内容进行梳理发现,主要分为理论研究、方法研究和应用层面研究。

理论研究主要围绕专利预警机制构建和专利预警体系设计的构建。在专利预警机制构建方面,对企业开展专利预警机制的基本原则及过程进行分析概括,并从国家、区域、行业、企业等不同层面构建专利预警机制[8-9]。在专利预警体系设计方面,刘桂锋从行业、企业和竞争对手三个层面分别构建专利地图[10];董新蕊等从专利审查角度,指出实现专利预警体系与专利审查过程的关联机制,提高了专利预警情报监控的准确性[11];刘介明等对海外知识产权风险的内涵及影响因素进行分析,从防控制度、流程等多方面提出了提升海外风险防控能力的措施[12];陈燕等根据专利导航项目实践,从专利与市场利益驱动、产业技术体系、产业技术演进三个层面阐释专利导航作用机理,提出了目前专利导航项目实施的思路“四个转变”,加快建立以大数据为支撑的系统化工作构架[13]。在方法层面,肖连杰等对大数据环境下国内情报分析的研究方法进行归类,从微观层面对情报分析方法归为七类:文献情报分析方法、知识组织分析的研究方法、数据挖掘分析方法、采用数学模型对数据进行分析的情报分析法、关联情报分析方法、以辩证唯物论等哲学方法为基础的认知情报分析法和科学评价的分析方法[14]。其中科学评价法是专利预警方法的主流方法,多是指标体系法,从宏观指标角度进行综合评估和预警[15],以及利用文本分析方法进行专利相似性检测侵权风险或解释技术发展路径[16-17]。通过对相关文献进行梳理,发现现有专利预警研究主要应用于专利侵权预警、技术监测和技术趋势预测[18-19]。

1.3专利预警现有研究的不足在预警内容层面,目前专利分析预警主要侧重于专利侵权风险的分析,鲜有对企业核心经营要素风险进行预警的相关研究。在方法层面,虽然已经有大数据分析方法如卷积神经网络等机器学习法用于专利分析预警中,但是大数据分析方法仅限于风险评估环节,没有贯穿整个专利预警项目实施流程,专利预警分析项目工作效率较低。在项目实施层面,绝大多数专利预警项目属于一次性任务,专利风险预警项目成果的指导意义会随着外部因素变化而失去参考价值。

2 专利助力企业经营风险预警的可行性分析

专利文献是技术创新产生的重要资源,包含技术、法律、市场、战略等综合情报,通过梳理专利情报中所蕴含的产业发展趋势,可以提高企业发现经营风险的前瞻性;通过对专利中具体技术方案的解读,可以提高企业判断经营风险的准确性;通过对全产业链专利信息的分析,可以提高企业对经营风险认识的全面性[20]。在此基础上,文章拟从专利视角,由传统的专利侵权风险分析,进一步扩展分析由于上下游供应链断裂导致的企业无法正常经营的供应链卡脖子风险,以及由于技术或产品被替代导致的市场被抢占风险。

传统研究中供应链风险的影响因素主要包括市场需求、政策、法律等外源因素,以及供应链依赖度、信息不流通、管理模式等内源因素[21]。专利是技术的载体,从技术的角度分析供应链卡脖子风险主要来源于企业核心产品的所需要的原料、设备、技术等方面[22-23]。首先,上游供应链技术与发达国家存在的技术差距会影响供应链断裂风险[24]。目前以知识产权为名的国际贸易摩擦愈演愈烈,供应链技术所用原料或设备的技术与发达国家差距较大时,供应链卡脖子风险也会相应增大,通过专利数量、专利质量等角度可以分析与发达国家的技术差距。其次,核心技术来源会影响供应链风险[24],通过专利可以分析供应链技术来源国以及领军企业,例如,美国之所以能够制裁华为、中兴等企业,主要原因是手机产业链中上游芯片技术来源国为美国、荷兰等。企业拥有核心技术,才能保证企业所提供的技术或原材料的稳定供应,若企业仅为代工厂或者技术均需购买,则存在供应链断裂风险。第三,技术垄断程度影响供应链风险[24]。通过专利集中度可以反映技术的垄断程度,上游供应链技术越集中,被卡脖子的风险越大,该规律与市场现象吻合。最后,通过专利分析可以进一步指出供应链卡脖子技术的细分领域,聚焦技术短板,对供应链卡脖子技术预警具有重要意义。

在创新不断加速的时代,市场的替代与被替代是技术发展的规律。市场被替代可以从市场环境或市场需求替代、技术替代、产品替代[25-26]等多个维度进行分析。由于专利与市场利益驱动之间的密切关联,因此,专利分析可以客观反映市场意图[13]。首先,市场维度,根据该技术对应的产品或服务在市场中的需求程度,来判断和评估市场对于技术的期望和需求状况。在技术维度,企业专利技术越先进、技术越稳定、应用的领域越广泛,被替代的可能性越小。在产品维度,产品成本化越低,越容易被接受,市场上相似功能产品越多,越容易被替代。因此,以专利信息为主要载体预测企业经营风险在理论上具备可行性。

大数据技术能够提高风险预警准确性和实效性[5],前人已有对大数据与专利分析融合进行探索[27],本文在前人研究基础上提出了基于大数据视角的企业专利预警系统,将大数据方法融入到预警流程中。该系统可以实现专利侵权风险预警、供应链卡脖子风险预警以及市场被抢占风险预警,对已经开展的专利风险预警项目进行实时动态跟踪,实现项目本身的信息迭代,同时本文提供的分析方法、应对策略也对相关领域的专利预警分析项目起到迭代规划的作用,指导相关领域专利预警项目的实施,从而为企业知识产权风险管理精准决策提供重要的参考价值。

3 基于大数据视角的企业专利风险预警系统

3.1基于大数据视角的企业专利风险预警系统的组成基于大数据视角的企业风险预警系统包括风险预警情报收集子系统、风险预警识别评估子系统、风险预警报警子系统、风险预警信息反馈子系统,这些子系统的功能依次是情报收集及处理、风险评估、风险报警和后续跟踪修改意见,可实现侵权风险、供应链卡脖子风险、市场被抢占风险预警,同时,对所有专利预警项目进行动态跟踪,实现预警项目闭环运行及其迭代规划,具体如图1所示。

3.1.1 风险预警情报收集子系统 该子系统重要功能是及时、全面的收集多源情报,并进行处理。针对侵权风险,重点收集竞争对手、产品相关信息;针对供应链卡脖子风险,重点收集供应链上游技术、以及平行技术相关信息;针对市场被抢占风险,重点收集市场上平行技术或相似产品相关信息。对于专利信息,专利分析人员确定技术边界,制定修正检索式,利用数据采集技术(元数据批量下载、爬虫等)和专利检索技术,构建专利采集系统,代替人工检索、逐条下载等复杂过程;同时,运用大数据技术通过互联网、用户反馈等收集企业所关注产品或技术相关信息,并运用大数据技术使得与专利信息建立高度关联性。采用分类、聚类等大数据技术,可将来自不同平台的专利数据去重、归一化处理,应用文本分析与语义分析进行标引,代替人工加工和标引,专利分析人员仅需依据领域技术知识将分类规则、技术功效词嵌入系统即可。

风险预警情报收集子系统以主流处理平台Hadoop平台为主要框架,该平台包含开源分布式文件系统HDFS,储存Hadoop全部节点的文件,其核心是Mapreduce并行处理系统,提供了并行计算框架,同时利用分布式数据库管理系统HBASE,对多种数据类型的随时访问和实时监测,从而将海量的专利数据提炼为高密度价值的元数据[28];同时利用人工干预的方式,对大数据分析所得的高密度元数据进行更正和完善,从而完成多元数据采集和分析。

风险预警情报收集子系统的另一个功能是关键因素分析。对市场内重要的竞争对手的相关产品、专利等关键因素进行重点分析和跟踪,例如通过社会网络分析挖掘关键技术的竞争对手,分析企业之间的竞争网络、合作网络等,了解竞争对手的专利布局、市场行为和研发重点[29];研发过程中的技术难点,要进行重点研判。

3.1.2 风险预测识别及评估子系统 该子系统是采用适宜的风险评估方法对专利风险进行评价。该子系统的核心是专利数据挖掘。运用卷积神经网络、支持向量机等机器学习的方法分析专利文本数据,运用分类、聚类、关联分析等找出与企业专利风险相关的指标,从中发现有价值的信息对风险进行评价。利用数据挖掘技术找出各项要素之间的关联性,确定可能影响企业专利风险的指标,同时利用有监督学习的方法赋予权重,如随机森林、逻辑回归、人工神经网络对历史数据不断自学习,能够动态地更新调整内部权重提高预警准确性和实效性[5]。

在专利侵权风险预警模块,主要采用文本相似度指标进行测度。使用余弦距离计算企业提供技术方案或产品特征与专利文本标题和摘要相似度:

(1)

其中,Sim(I,p) 表示两企业提供的技术方案或产品特征i和专利文本p之间的相似度,余弦值越接近1,两个向量则越相似[30]。同时可结合专利权人的诉讼经验、专利的诉讼历史进一步推荐可能提起侵权诉讼的专利。

供应链卡脖子风险预警模块,主要功能是从专利的角度识别由于上下游供应链卡脖子导致的企业无法正常经营的风险。利用企业经营数据,例如企业市场份额、供应商信息等对供应链卡脖子风险进行预判,进一步利用专利大数据实现从宏观到微观对供应链卡脖子技术分级预警。在宏观预警层面,可实现技术领域供应链卡脖子技术识别。通过梳理企业技术的原料、设备、工艺等环节的核心专利,在进行核心技术专利评估时,多采用机器学习的方法进行高质量专利的识别[31],以专利文献引证为基础,通过引证指数和技术扩散指数进行测度时,引证指数计算时需要考虑设置衰减因子平衡引证次数和时间的关系[32]。利用大数据的方法测度技术垄断程度、技术攻克难度、技术可替代性,从宏观层面识别供应链卡脖子风险。例如,技术垄断程度可通过核心专利集中度进行测度,通过CRn、赫芬达尔-赫希曼指数、洛伦兹曲线和基尼系数结合等[33]来衡量,技术攻克难度可以通过技术差距指数进行测度:

x=(Ntop1-Nc)/Ntop1

(2)

其中x为技术攻克难度,Ntop1表示在该领域中处于第一位的国家对应的核心专利数,Nc表示中国在该领域中分布的核心专利数。x的值域是[0,1],x的值越大,则表示中国与垄断国家的差距就越大。进一步,利用技术、功效、企业三维技术功效分析模型[34]从微观层面找出聚焦卡脖子位点,实现卡脖子细分领域技术识别。

市场被抢占风险模块,主要功能是识别企业的关键技术或产品被其他技术替代的风险。在监测市场被抢占风险时,从市场、技术和产品三个维度进行分析,每个维度设置多个分析指标。例如技术维度可以技术稳定性、技术先进性和技术通用性为指标,每一个二级指标可进一步细化出三级指标,三级指标均可在一定程度识别风险。例如技术差异度指标,柯达曾经在“胶卷时代”独自称雄。2003年,近8 000家柯达冲印布满了国内大小城市,达到市场利润最高值,但是,自2003年以后,逐步走向衰退,通过对柯达2000年到2003年专利技术进行分析发现柯达技术布局与世界主流技术趋势存在较大差异,因此可以通过技术差异度识别市场被抢占风险。在进行风险评估时,可将每个层面的所有指标通过大数据分析方法赋予权重,进行风险识别和评估[5]。

3.1.3 风险预警报警子系统 报警子系统是评估结果的输出。报警子系统根据风险的性质和危情程度对企业专利侵权风险、供应链卡脖子风险和市场被抢占风险进行预报警和提示警戒状态。风险预警报警子系统可以实现对企业专利预警工作开展的预报警。企业进行风险预警时往往提供多个技术点,专利分析预警工作人员需要对其进行优先级排序,从而在有限时间创造更高的价值。进一步,通过技术相似度或指标评价法等大数据分析的方法,向企业提示警戒状态。

3.1.4 风险信息预警反馈子系统 该子系统根据报警结果采取相应的应对策略。针对企业的技术方案和产品,通过专利检索、关键因素分析,根据评价指标不同预测不同类型的风险。同时,通过建立企业专利风险预警专题数据库,结合专利风险预警流程,实时更新风险预警内容动态监控风险。实现项目本身的信息迭代,同时对相关领域的专利预警分析项目起到迭代规划的作用,从而指导相关领域专利预警项目的实施。

3.2基于大数据视角的企业专利风险预警系统的特点基于大数据视角的专利侵权风险预警系统应具备以下特点:

3.2.1 全面、动态、实时预测风险 除了识别专利侵权风险外,对供应链卡脖子风险以及市场被抢占风险进行预警,使得预警内容更全面。针对每个专利风险预警项目,结合专利预警项目的流程,分模块建立专利风险预警专题数据库,该专利数据库可实现专利检索、专利风险评估及预警功能。

3.2.2 情报收集更全面 在开展情报收集之前,首先要与企业进行预警需求的对接。在此基础上,还要收集专利信息相关联的产业、市场、技术、商业等信息。例如,在收集竞争对手专利的同时,还要收集竞争对手相关的学术论文、商业信息、新闻、动态社交网络、行为数据等,运用大数据分析方法收集和处理企业经营相关的市场和产业数据,并进行聚类、分类,使得专利数据和企业经营相关数据深度融合。除了收集专利文献数据外,还要补充专利审查数据,审查员依法审查智慧劳动成果,使得技术评价更准确。上述特点为专利大数据预测风险提供基础。通过大数据分析方法使得专利信息与技术、市场、产业等数据建立高度关联性,从而呈现出多维、立体、全面的数据网络。

3.2.3 兼顾高效性与准确性 专利数据的收集和处理要以大数据框架为骨架,运用先进的大数据算法,对专利技术进行去噪、加工、标引,达到以大数据机器学习为主,人工辅助进行专利信息分析,从而兼顾数据处理高效性和准确性。例如,传统的专利风险预警中,去噪和标引占据了非常大的工作量,专利分析人员需要对文献的技术主题、技术内容等进行标引。随着专利文献数量增加,标引工作面临巨大的挑战。目前有的专利分析软件可以实现自动标引,通过聚类、分类等分析方法统计高频关键词、分类号等信息便于计算机自动标引,但是往往由于高频词汇不能正确反映完整的技术信息而导致技术分析不准确等,因此,通过大数据分析方法实现人工智能标引和人工干预方式进行专利标引是未来研究的重要内容。

4 总结与展望

本文梳理近10年专利预警研究相关内容,指出了现有研究主要关注专利侵权风险,并未对企业生产经营环节特别是核心经营要素风险进行重点防范。本文结合企业专利风险预警实务工作,提出了基于大数据的企业专利风险预警系统。该系统不仅可以预测侵权风险,还可以对供应链卡脖子风险和市场被抢占风险进行预测,使得预警内容更全面。在预警项目实施和管理方面,建立专利预警项目专题数据库,对所有专利预警项目进行动态跟踪,实现预警项目闭环运行及其迭代规划。知识产权服务机构可以通过该系统科学的实施专利预警项目,充分利用大数据技术提高专利分析效率,同时实现专利预警项目的动态监测和闭环运行。

本研究构建了基于大数据的企业专利风险预警分析框架,积极运用大数据分析方法,提高预警方法的实效性;同时,通过大数据与专利预警的高度融合,将企业专利风险内容进一步拓展到供应链卡脖子风险和市场被抢占风险,完善了企业专利风险预警理论,拓宽专利大数据的分析应用范围,对企业风险预警提供精准决策具有重要意义。

尽管大数据与专利预警分析的结合是大势所趋,但是现阶段仍存在诸多困难:运用大数据技术处理收集、多源异构数据时,对于不同维度、不同类型数据的分类、聚类、关联、交互需根据分析对象和目的不同需要分别建模,对数据处理的要求越来越高。目前运用大数据方法进行情报分析处理时需要一定程度的人工干预同时进行,如何考量人工智能和人工干预的权重问题是下一步努力的方向。因此,大数据技术和专利分析技术的复合型人才培养是未来知识产权服务机构人才培养的重要环节。

猜你喜欢

卡脖子预警专利
本期导读
预警型智能包装在食品安全中的应用和设计
种子科技:打赢种业翻身仗 如何破解“卡脖子”难题
超级秀场 大风预警
全省农业科技“五五”工程暨农业“卡脖子”关键技术攻关推进会在黄冈召开
卡脖子与保鲜问题
预警个啥
2007年上半年专利授权状况统计