APP下载

基于SAO 语义分析与多维技术创新地图的技术创新机会识别研究

2023-01-10冯立杰王清华王金凤张世斌

科技管理研究 2022年23期
关键词:层级语义机会

冯立杰,王清华,王金凤,3,张 珂,张世斌

(1.郑州大学管理学院,河南郑州 450001;2.上海海事大学物流工程学院,上海 201306;3.上海海事大学中国(上海)自贸区供应链研究院,上海 201306;4.华北水利水电大学机械学院,河南郑州 450045)

1 研究背景

技术创新是提高社会生产力和综合国力的战略支撑,而技术创新机会作为技术创新的起点,是企业、产业和国家层面实现创新的关键,对制定创新决策及提高核心竞争力至关重要。技术创新机会作为一个复杂巨系统,可视为创新环节中诸多要素的潜在组合[1]。传统的技术创新机会识别方法大多侧重于基于专家经验开展定性分析。然而,伴随着相关情报数量的几何级递增及技术创新领域划分的日益细化,专家的知识及专长越来越难以满足目标创新系统的具象需求,对此,定性与定量分析相结合识别技术创新机会的方法越来越受到企业的青睐[2]。其中,基于关键词分析和SAO(subject-action-object)语义分析的相关研究尤为广泛[3]。

关键词分析方法主要借助高频词或关键词表述创新主题的特征,在探究主题词之间关联度的基础上研判技术创新机会。如Yoon 等[4]通过从专利文献中抽取关键词,利用生成式拓扑映射法构建可视化专利地图,并利用链路预测算法评价指标界定了有价值的技术创新机会;Shen 等[5]通过构建向量空间模型从科技论文及专利文献中抽取关键词,并基于Orclus clustering algorithm对关键词进行主题聚类,利用主题间的语义相似度界定了技术创新机会;潘东华等[6]通过从期刊文献中提取关键词并构建共词图谱,利用时序图谱对关键词聚类,以聚类的动态属性界定了技术创新机会。

而SAO 语义分析方法则主要借助技术组件的关键概念和结构表述创新主题的特征,在剖析其中包含的语义关系基础上研判技术创新机会。如Yoon等[7]利用SAO 结构相似性进行了专利聚类,以“离群性”指标实现了对离群专利的界定和评价;黄鲁成等[8]分别从专利文献和期刊文献中抽取了SAO 结构并进行了相似性计算,在采用多维尺度剖析聚类结果后,将论文中存在而专利中不存在的主题界定为技术创新机会;李乾瑞等[9]利用SAO 结构构建了技术形态矩阵,并以技术价值、社会经济效用、产业可行化和中国产业化作为评价指标,采用模糊一致矩阵法识别了技术创新机会;赖朝安等[10]对SAO 结构进行关联分析以实现对专利文本的特征表示,并将专利地图上的空白点界定为技术创新机会。

显然,国内外学者众多的技术创新机会识别方法为本文提供了重要的参考。然而,现有研究仍存在以下不足:首先,在创新要素挖掘方面,基于关键词的系列方法难以系统考量主题特征词在领域内的表征能力[11],由此可能导致对创新要素的理解产生偏差,继而影响技术创新机会识别的准确性;而基于SAO 语义的系列方法则会囿于领域主题相关性识别所限[12],可能导致部分创新要素的丢失,继而影响技术创新机会识别的全面性。其次,在技术创新机会识别方面,现有文献多采用单一规则(如离群性阈值筛选或链路预测)遴选技术创新机会,将不符合该规则的创新机会予以排除,由此可能错失有价值的技术创新机会[13]。此外,部分文献借助技术形态矩阵对创新要素进行了直观呈现或组合表达[14],但较少考虑对创新要素采用特定法则进行迭代变换,由此可能会使技术创新机会识别存在一定的盲目性和无序性。

有鉴于此,本文将集关键词分析和SAO 语义分析两种方法之所长,进行关键创新要素的深度挖掘及层级关系梳理,以多维技术创新地图导航并作为切入点进行概念化和具象化双层技术创新机会识别,在为企业有效降低技术创新风险的同时,精准、前瞻性预判具象技术的创新先机,进而不断提升企业的核心竞争力。

2 理论基础

2.1 SAO 语义分析

SAO 结构是基于主体-行为-客体,从文本语料中抽取的三元组结构Subject-Action-Object[15],其中的主体S(Subject)和客体O(Object)为名词元素,行为A(Action)为主客体之间的动作或关系[16]。显然,基于S/O 元素可开展实体分析,如通过提取SAO结构,可对S或O名词元素的出现频率进行分析,以识别具象领域的核心技术组件[17]。同时,也可基于A 元素开展主客体间的关系分析,如通过对A元素的识别,可将SAO 结构划分为Partitive SAOs 和Attribute SAOs,以识别关键概念之间的关系及特定问题的解决方案[18];也可利用SAO 结构中具有“包含”关系(如:has,comprise)的A 元素,将多个SAO 结构进行串并联构建SAO 语义链,以识别多个关键词间的关系,进而辅助构建产品或技术形态结构[19],从而有效实现对技术变革方向和技术及创新机会的预测[20]。

进一步地,基于关键词挖掘和SAO 语义层级识别构建的SAO 语义链可从语义视角深度挖掘相关专利的核心信息,厘清关键词之间的层级关系,以提升专利分析的准确性和全面性。

由此,本文将在构建SAO 语义链基础上,拓宽对表示“是”关系的A 元素识别区域,以获得细粒度技术关键词的表征,实现对目标技术创新系统较为精准的关键创新要素甄别,为后续研判技术创新机会奠定基础。

2.2 多维技术创新地图

多维技术创新地图融合了TRIZ、SIT、核检表法和专利功效矩阵等创新理论[21],将创新的实质归纳为创新维度(包括机理维、材料维、环境维、空间维、结构维、功能维、动力体系维、时序维和人机关系维)和创新法则(包括分解与去除、组合与集成、局部优化、替代、动态化、自服务、友好化、柔性化和智慧化)耦合的过程[22]。该方法主要针对目标技术创新系统,首先以创新维度导航,搜寻影响技术创新的基本要素,继而借助创新法则对创新要素变换重组识别技术机会,最后根据反馈不断改进完善,输出系列技术创新机会[21]。

多维技术创新地图目前已广泛应用于3D 打印[23]、煤层气开采、软件产品和智能手机研发等领域的具象创新机会识别[24]。结果表明,在提取目标创新系统关键创新要素基础上,利用创新法则进行维法耦合以挖掘系列技术创新机会,能够为企业高效开展技术创新提供科学的决策参考依据。

3 研究框架

基于SAO 语义分析与多维技术创新地图,本文构建了技术创新机会识别框架,如图1 所示。首先,以专利文献作为数据源,利用关键词共现分析筛选相关专利;其次,利用过滤后的SAO 结构搭建SAO语义链,获得关键词之间的语义层级关系,实现关键创新要素甄别;再次,结合专家经验和多维技术创新地图对维度的界定,对创新要素进行维度划分;最后,选取创新法则,对不同层级的创新维度进行迭代变换构建多维技术创新地图,实现双层技术创新机会的识别。

图1 基于SAO 语义分析与多维技术创新地图的技术创新机会识别框架

3.1 专利数据搜集

该过程需要以目标创新系统的关键词作为检索词,通过检索特定数据库以界定创新的边界。具体包括:一是明晰目标创新系统亟待解决的具象技术创新问题;二是科学合理选择检索平台;三是基于相关文献及专家经验,确定检索表达式并下载专利文本;四是采用特征词初始筛选和手动标记相结合的方式来筛选专利。通过咨询专家确定2~3 个领域特征词,继而使用Python 将摘要文本数据与特征词匹配,剔除不含特征词的数据,并在阅读标题和摘要的基础上,采用背靠背数据标记方法消除噪声文本,得到与目标创新系统高度相关的专利数据库。

3.2 基于SAO 语义链的关键创新要素提取

3.2.1 基于关键词的文本挖掘

该过程需要采用关键词文本挖掘方法开展共现分析,进一步筛选专利数据库,获得含有关键词的专利数据集。具体包括:

一是高频词提取。通过去除停用词、标注词性、抽取特征词,以抽取专利数据库的高频词。在剔除无实义词和功效词后,将抽取的高频词作为关键词,进而得到目标创新系统的关键词集。

二是关键词共现分析。基于上述关键词集开展共现分析,还需剔除未包含共现关系的专利,继而得到包含关键词的专利数据集。因明晰关键词之间的层级关系所需,还应剔除不含或仅含一个关键词的专利文本,为后续SAO 结构抽取减少数据量。需要补充说明的是,该数据集同时为后续创新法则的选取提供了数据支持。

3.2.2 基于SAO 结构的层级识别

该过程需要采用SAO 语义分析方法,对数据集进行SAO 结构抽取并筛选通过构建语义链识别目标创新系统的关键词语义层级结构。具体包括:

一是SAO 结构抽取。首先,对数据集进行单句切分及分词;其次,根据训练语料库构建词性标注器,对分词结果进行标注并进行依存关系分析;最后,利用Stanford Parser 抽取SAO 结构。

二是SAO 结构筛选。首先,基于A 元素语义筛选表征“包含”关系(如:comprise,involve,is,include)的SAO 结构;其次,基于S/O 元素,剔除不含或仅含有一个关键词的SAO 结构,进而得到多个表征目标创新系统中关键词之间层级关系的SAO结构。

三是SAO 语义链构建及关键词语义层级关系识别。首先,对上述SAO 结构中的S/O 元素进行模糊匹配,得到多个相似的SAO 结构;其次,根据SAO结构中A 的语义,判别S/O 元素的层级关系,通过串并联SAO 结构形成语义链,识别关键概念间的语义关系;最后,合并整理语义链,可得到目标创新系统技术关键词的层级关系结构图,进而关键实现关键创新要素的提取[19]。

3.3 基于维法耦合的双层技术创新机会识别

3.3.1 创新维度的划分

该过程需要在明晰技术关键词语义层级关系基础上,结合专家经验,以多维技术创新地图中的九大创新维度导航,对前述关键创新要素进行维度划分。具体包括:

一是以目标创新系统关键词语义层级关系为基础,确定维度划分的层级。

二是根据多维技术创新地图中九大创新维度的定义,对关键创新要素进行逐一归类。

三是整理维度划分结果并绘制目标创新系统的创新维度表。

3.3.2 创新法则的选取

该过程需要以前述共现分析的专利数据集作为对象,对技术创新机会进行“维”“法”耦合,即剖析创新要素的构成规律并选取创新法则。此过程一方面需要提取目标创新系统适用的创新法则,为后续创新法则选取提供指导;另一方面还需对上述划分的创新维度进行合理性验证。

3.3.3 双层技术创新机会的识别

该过程需要依托SAO 语义链识别的关键词语义层级关系,结合多维技术创新地图进行双层技术创新机会识别。具体包括:

一是第一层概念化技术创新机会预判。该过程一般在维度和子维中进行,基于影响技术创新的单一或多个维度,与创新法则进行迭代变换,可衍生出多个概念化技术创新机会。一般而言,该层技术创新机会的粒度较为宏观,可为目标创新系统中具体技术创新机会的生成减少大量无意义的方案组合,同时预判有价值的研发方向,但该层较难产生映射具象技术细节的创新方案。

二是第二层具象化技术创新机会识别。该过程一般在目标创新系统的具体技术形态中进行,需要在前述概念化技术创新机会引导下,结合具体技术形态,生成系列粒度较细的、可行而具体的技术创新方案。

4 案例分析

海绵钛因提炼成本高、对批次的稳定性和质量要求高、而我国的相关冶炼技术落后,长期以来制备原料主要依赖进口,严重掣肘了我国未来的“空间站计划”“大飞机计划”以及“舰船建造计划”等项目的实施进程[25]。进一步的,富钛料作为海绵钛生产的重要原料,其制备技术对钛工业的发展尤为重要。因此,本文将以富钛料制备技术为例,进行基于SAO 语义分析与多维技术创新地图的技术创新机会识别研究,以期为极大地改善我国富钛料制备技术落后局面,以满足航空航天、船舶和海洋工程等中高端技术领域对钛材不断增加的需求,同时形成富有竞争力的钛工业产业技术提供创新方法支持。

4.1 富钛料制备技术专利信息检索

有鉴于德温特数据库(Derwent Innovations Index,DII)覆盖领域主要包括化学、电气和工程等3 大领域[26],由此能够较好地与富钛料的制备领域属性相匹配。因此,本文以德温特专利数据库作为检索平台检索相关专利。具体包括:

首先,对该领域的专家进行访谈以确定检索表达式(见表1);其次,通过检索表达式进行富钛料制备技术专利信息检索,共计获得598 条相关文献;再次,选定 titanium 和rutile 为特征词与摘要文本进行匹配,并采用背靠背数据标注方式对专利进行识别,最终得到392 份与富钛料制备技术高度相关的专利。

表1 富钛料制备技术专利检索表达式

4.2 基于SAO 语义链的富钛料制备技术关键创新要素提取

4.2.1 基于关键词的富钛料制备技术文本挖掘

一是高频词提取。首先可采用NLTK 自然语言处理工具包,利用Python 语言编程对得到的392 条专利数据摘要及权利要求书等文本进行自然语言处理,实现去停用词、词性标注、特征词抽取和高频词统计;然后取前500 个特征词作为关键词,通过剔除无实义词、功效词等,最终可得到与富钛料制备技术创新相关的178 个主要关键词。

二是关键词共现分析。为确定富钛料制备技术领域的关键技术形态,还需对前述178 个关键词进行共现分析,由此可得到领域内178×178 关键词共现矩阵。在剔除未包含共现关系的64 条专利后,可得到后续进行SAO 结构抽取和创新法则选取的系列数据。

4.2.2 基于SAO 结构的富钛料制备层级识别

一是SAO 结构抽取及筛选。首先,采用自然语言处理工具Stanford Parser 和Spacy 工具包,利用Python 语言编程,对上述数据集的摘要及权利说明书等文本进行SAO 结构抽取;其次,剔除未含有层级关系的SAO 结构;再次,保留包含两个或两个以上关键词的SAO 结构,最终可得到276 条SAO 结构(部分结构见表2)。

表2 有效SAO 结构表(10/276)

二是SAO 语义链构建及关键词语义层级关系识别。首先,依托上述SAO 结构对SAO 结构中的S/O 元素进行相似性匹配,如:在The preparation of synthetic rutile(S1)involves(A1)pretreating ilmenite ore(O1)结构和The pre-treating of the ilmenite(S2)comprises(A1)milling by a dry ball mill to obtain the ilmenite particles(O2)结构中,O1元素和S2元素可进行模糊匹配;其次,构建SAO 语义链(部分结构见表3);最后,合并整理语义链,进而构建富钛料制备技术领域的关键词层级关系结构图。如图2所示。

图2 富钛料领域关键词层级关系结构

表3 基于SAO 的富钛料制备技术领域层级关系结构(10/57)

4.3 基于维法耦合的富钛料制备技术双层创新机会识别

4.3.1 富钛料制备技术的创新维度划分

结合多维技术创新地图对创新维度的定义、富钛料制备技术领域专家知识及SAO 语义分析识别出的关键词层级关系,可将前述关键创新要素逐一分别归入机理维、材料维及环境维度。具体见表4。

表4 富钛料制备技术创新维度

表4 (续)

其中,机理维是富钛料制备技术涉及的物理、化学等基本原理,主要包括富钛料制备的各种具体技术(如氧化焙烧、助剂改性还原和煅烧等);材料维是富钛料制备技术所涉及的各种材料(如氧气、盐酸和氢氧化钠等);环境维是富钛料制备技术所涉及的环境参数,包括富钛料制备过程中的温度、压力及时间等(如氧化焙烧温度、还原温度、高温煅烧和还原时间等)。

4.3.2 富钛料制备技术的创新法则选取

在维度划分基础上,结合多维技术创新地图对创新法则的定义,可对共现分析后的数据集进行再次查阅,进而选取20 个技术创新机会进行“维”“法”耦合分析,以提取富钛料制备技术领域常用的、在技术创新机会识别过程中优先考虑的创新法则,见表5。

表5 富钛料制备技术已存在专利的“维”“法”分析(10/20)

由表5 可以看出,在富钛料制备技术领域使用的主要创新法则有:局部优化、组合与集成、友好化、分解与去除。对相关创新法则进一步诠释如下:

一是局部优化法则。在富钛料制备过程中,某一机理的优化可直接提高富钛料的品质或缩短工艺流程。如添加助剂可改变原有反应物结构并增加其活性,更有利于浸出后续的杂质;将某一过程置于高温或高压状态可以增加反应速率。

二是组合与集成法则。该法则在富钛料制备过程中既可表现为多种工艺流程的组合,也可表现为单一工艺的重复。如表5 中专利CN111979413A 采取的多级酸浸,不仅能够提高产品中二氧化钛的品位,同时能够增加盐酸利用率,继而有效降低母液再生酸的成本。

三是友好化法则。现有富钛料制备工艺流程易产生大量废渣、废气及废液,而且能耗较高,显然,如何实现环境友好型生产是当前富钛料制备技术研究的热点[27]。对此,可将回转窑煅烧改为天然气热风炉闪干,或将传统高温还原工艺改为微波高温还原以节能降耗,继而达到降低成本的目的。

四是分解与去除法则。传统的富钛料制备工艺中,电炉钛渣硅杂质组分的去除主要以碱浸为主,由此会产生大量的废碱。因此,聚焦于脱硅研究以去除碱浸脱硅工序,不仅能够有效降低生产成本,而且能够减少对环境的污染。

4.3.3 富钛料制备技术的双层技术创新机会识别

依托于上述三级创新维度的划分,优先考虑将局部优化、组合与集成、友好化及分解与去除等创新法则作用于不同层级的创新维度,可构建多维技术创新地图(部分方案如图3 所示),从而识别出多个富态料制备技术的双层创新机会。

图3 富钛料制备技术多维技术创新地图

第一层是概念化技术创新机会的预判。该层主要依托维度和子维度生成的概念化技术创新机会,预判富钛料制备技术领域有价值的研发方向。

如在机理维中,可选择多个子维进行变换实现对风化程度不同、品位不同钛铁矿的升级处理以提升除杂效率;在机理维和材料维组合中,可在氧化焙烧过程添加特殊改性剂促使杂质组分更易溶解;在机理维、材料维和环境维组合中可加入特殊介质,并通过相应温度及压力变化,优化富钛料制备技术工艺。预判的概念化技术创新机会见表6。

表6 第一层富钛料制备技术概念化技术创新机会预判

第二层是具体技术创新机会的识别。该层将依托第一层研判的概念化技术创新机会,运用创新法则对选取的技术形态进行迭代变换,进而识别出富态料制备技术的具体创新机会。包括:首先选定机理维中影响富钛料制备技术的机理,然后确定实现机理所需的环境条件,最后选取相应的材料作为辅助工具以支持技术创新过程。对应表6 识别的富钛料制备技术创新机会见表7 至表9。

表7 基于机理维的富钛料制备技术创新机会识别

表8 基于机理维和材料维的富钛料制备技术创新机会识别

表9 基于机理维、材料维和环境维的富钛料制备技术创新机会识别

由于上述所识别出的富钛料制备工艺技术机会源自作者团队与龙蟒佰利联集团股份有限公司的产学研合作研究课题,后续团队在实验室进行了系统实验,验证了上述技术创新机会的合理性和可行性。以方案3 为例,相关实验结果表明:(1)在回转窑中的钛铁矿经高温氧化焙烧,其物相结构被破坏,钛渣得以富集,产品细料率显著降低;(2)换热器收集氧化焙烧阶段的温度以用于后续锈蚀液的加热,一定程度上降低了热能耗;(3)锈蚀阶段的催化剂加快了反应速度,并得到了钛品位较高的人造金红石。经该企业技术人员和有关专家确认,方案3 可提高生产效率,降低“三废”排放量,且具有能耗小、污染低的特点,可为企业清洁高效生产提供新思路。综上,本文所提技术机会识别路径具有一定的先进性和实用性,可为相关企业突破技术创新瓶颈提供有效支撑。

5 结论与展望

本文融合SAO 语义分析和多维空间技术创新地图构建了技术创新机会识别方法,并以富钛料制备领域的技术创新为例验证了该方法的有效性。本文的研究贡献主要体现在3 个方面:首先,以往采用单一关键词或SAO 语义方法挖掘创新要素的研究存在要素主题表征较弱且内在联系模糊的局限性,本文从功能互补角度将两者融合深度挖掘影响技术创新的要素,并对关键创新要素进行层级关系梳理,进而形成层次分明的技术形态,有利于清晰、准确地甄别创新要素。其次,以往利用单一规则或构建形态矩阵进行技术创新机会识别的研究技术创新机会数量有限且存在一定的盲目性和无序性,本文以多维技术创新地图导航对关键创新要素进行维度、子维及技术形态等三级创新维度划分,并与创新法则耦合,实现了概念化和具象化两层技术创新机会的识别,既对企业选择技术标杆和研发方向具有指引作用,也可为企业具体研发实践活动提供方案指导。最后,现有技术创新机会识别的相关文献大多集中在机械制造领域,较少涉足化工领域,本文以富态料制备技术为目标创新系统,借由上述方法生成的两层共9种富态料制备技术创新方案切实可行,对推动我国富钛料制备技术的快速发展,乃至于对破除严重掣肘我国未来的“空间站计划”“大飞机计划”和“舰船建造”等计划的钛工业产业发展藩篱,具有重要的现实意义。

本文仍存在一定局限性有待于进一步加以改进。首先是本文构建的技术关键词层级结构图主要依赖于自然语言的挖掘,难以囊括技术领域全部特征词,未来可从语义理解角度进行信息抽取,借助领域专家构建用户词典,以获取更为完善的领域特征词表。此外,本文从技术角度对创新机会进行识别的研究,缺乏针对技术创新方案的系统性和综合性评价,有可能导致与研发主体的能力不相匹配,未来还需深入创新主体研发实践过程强化对技术创新机会进行系统评估。

猜你喜欢

层级语义机会
真实场景水下语义分割方法及数据集
科室层级护理质量控制网的实施与探讨
军工企业不同层级知识管理研究实践
基于军事力量层级划分的军力对比评估
给进步一个机会
语言与语义
职务职级并行后,科员可以努力到哪个层级
最后的机会
给彼此多一次相爱的机会
没机会下手