APP下载

基于生食牡蛎HACCP计划的语义建模研究

2021-02-10邹一波李清雨

农业机械学报 2021年12期
关键词:牡蛎限值实例

邹一波 李清雨 陈 明 葛 艳

(1.上海海洋大学信息学院, 上海 201306; 2.农业农村部渔业信息重点实验室, 上海 201306)

0 引言

水产品极易被污染,其质量安全风险高于其他类别食品[1]。危害分析及关键控制点(Hazard analysis critical control point, HACCP)是一种全面的、系统的控制体系,具有严格的记录保持程序,可以降低食品行业风险[2],对水产品安全性和可靠性的提高也有积极的作用。因此研究HACCP计划的信息化、数字化应用,对于提升生产和销售环节的安全性和可靠性有积极的作用。

目前,已有众多研究者开展了这方面的研究[3-13]。但这些研究主要集中于HACCP计划的信息化应用、HACCP计划的优化或者各种新兴信息技术和HACCP计划的结合应用。在此基础上,还出现了有关HACCP的应用研究[14-16]。但针对如何把HACCP计划中的知识作完整的数字化提取,实现HACCP计划的知识表达和推理,相关研究还不多。

为提高水产品流通过程中的质量安全风险信息化管理水平,本文将生食牡蛎HACCP计划(无特别说明,下文均用HACCP指代生食牡蛎HACCP)与语义建模相结合,提出基于生食牡蛎加工HACCP计划的语义基础模型(HACCP semantic base model,HSBM),用来实现知识提取、知识表示、知识建模以及知识推理,以语义的方式将HACCP计划的知识固化到信息领域,为HACCP计划的数字化应用奠定语义基础。

1 HACCP语义建模概述

1.1 生食牡蛎HACCP计划概述

参照文献[17]进行生食牡蛎HACCP计划的完整知识表示研究。

生食牡蛎HACCP计划经危害分析确定活牡蛎接收、干法冷藏、牡蛎肉储存3个环节,分别从显著危害(HA)、各预防措施的关键限值(CL)、监控(CM)、纠偏行动(CA)、验证(VE)、记录(RE)6方面展开描述。其中每个环节从不同的危害角度,对与各环节、各危害相关的温度、时间等作出要求,并对出现偏差可能会发生严重危害的关键点进行监控,如果监控发现该点超出关键限值的要求,则对该操作进行纠偏,通过每天审查监控、纠偏记录等方式进行验证。另外,在计划表中的每个操作都要进行记录,记录也作为每个操作的凭证。具体的生食牡蛎HACCP计划[17]如表1所示。

表1 生食牡蛎HACCP计划Tab.1 HACCP schedule of raw oysters

1.2 HACCP语义建模基础

HACCP语义建模过程就是对HACCP作知识提取、知识表示、知识建模以及知识推理的过程。HACCP计划既有结构化的知识,又有非结构化的知识,并且涉及到工作流程问题,计划内容繁多,关系复杂,流程之间信息无法共享,因此准确描述HACCP中的相关知识,加强机器对数据的理解,为后续的知识推理及实际应用打下良好的基础成为要解决的关键问题。

知识表示是使用合适的知识表示方法[18]对HACCP知识进行分析整理,得到概念、关系、实例等相关知识,对知识进行新的描述,使计算机能对生食牡蛎知识进行有效的表达[19]。知识表示是知识建模与推理的基础。

知识建模的过程实际上就是建立本体的过程,对HACCP计划中的知识进行科学的表示、获取和组织。本体(Ontology)可有效地实现知识表示,得到可以被机器处理和共享的抽象模型[20]。它由概念、概念之间的关系以及概念之间的约束组成[21]。而OWL2(Ontology Web languag 2)是一种网络本体语言,拓展了领域知识的表达和推理能力[22],是一种针对领域知识而通用的建模语言,可实现与本体建模工具的交互[23-24]。

为了增强知识推理能力,在知识表示的基础上,使用语义网规则语言(Semantic Web rule language,SWRL)建立规则,使用推理机获取新的知识。

SWRL以逻辑形式来表达规则,根据已有知识得到隐含知识,具有较强的逻辑表达能力[25]和推理能力[26]。每条规则的基本语法[27]为

P1,P2,…,Pn→C′

(1)

式中,P1、P2、…、Pn以及C′都是基本命题,P1、P2、…、Pn这些基本命题之间是逻辑与的关系,它们统称为前提,C′称为结论。式(1)的含义是,如果前提P1、P2、…、Pn成立,则结论C′成立。

基本命题P还可以拓展为形如P(?x,?y)的限制式,此时,x、y可以是变量或实例,P表示x、y之间的某种关系。

知识推理可以在知识建模的基础上通过本体推理或规则推理获取新的知识。

本体推理是通过概念的约束条件对本体模型中概念的推理,保证本体模型中概念的一致性。本体推理为规则推理提供前提条件,可使用HermiT、FaCT++等推理机实现。

2 HSBM模型概述

结合生食牡蛎业务流程与HACCP计划特点,对HACCP计划中的概念、关系、实例及规则等进行提取设计本体模型,并借助本体建模工具实现该模型,形成生食牡蛎HACCP计划的语义基础模型(HSBM),该模型的语义建模层次架构如图1所示。

按照不同的业务逻辑,该模型分为4层,自底向上分别是:领域知识层、知识表示层、知识建模层和知识推理层。

领域知识层是模型的基础层,对内容繁多、关系复杂的HACCP知识作梳理,该层为模型最底层,为上层系统和业务实现提供领域知识支撑。知识表示层是模型的核心层,将领域知识用本体建模方法完成元素抽取。知识建模层是模型的实现层,对知识表示层抽象表达的知识作具体的本体描述。知识推理层是模型的补充层,按规则或约束条件实现知识的推理,得到新的知识,从而丰富HACCP计划知识,形成概念化、形式化、结构化的本体知识库。

2.1 领域知识层

围绕HACCP 计划中的活牡蛎接收、干法冷藏、牡蛎肉储存3个关键控制点,以及每个关键控制点覆盖的显著危害、关键限值、监控内容、纠偏行动、验证和记录来获取相关知识。其中的典型知识分析如下:

(1)在活牡蛎接收、干法冷藏、牡蛎肉储存各环节中,活牡蛎接收环节会有捕捞产生的捕捞标识牌、捕捞许可证、捕捞时间牌等标识,接收之后对牡蛎进行简单处理,进入干法冷藏、储存环节,要保证从捕捞到冷藏库以及从冷藏库到储藏间运输过程中的食品安全性。

(2)活牡蛎接收包括致病菌污染、致病菌生长、环境化学污染、天然毒素4种显著危害,针对各危害制定HACCP计划;干法冷藏和牡蛎肉储存环节确定致病菌生长为显著危害,围绕致病菌生长制定HACCP计划。

(3)在实施 HACCP 计划中,会有许可证、标识牌类的监测信息贯穿业务流程,它们是检测该批水产品是否满足关键限值的重要依据。

(4)还有一类监控信息是温度、时间。如果监控值不符合关键限值的要求,则产生拒收的纠偏行动。同时需要对监控、纠偏等进行验证。不管监控的结果是否符合关键限值的要求,都要产生记录,以作为该批水产品接收或拒收的依据。

2.2 知识表示层

上述HACCP 领域知识可抽象为一个知识表示模型(Knowledge representation model-HACCP, KRM-HACCP),该模型由领域的抽象概念集C和与概念相关的关系集R组成。其中概念集是HACCP计划中包含的所有概念形成的集合,概念集Cn={C1,C2,…,Ci},每个概念可以具像化为多个实例I,由此又形成实例集In={I1,I2,…,Ii},I⊂C。

(1)概念提取

建立完整的概念集是构建一个本体的基础,结合2.1节领域知识描述,概念集合C包括:对生食牡蛎业务流程的抽象形成生食牡蛎业务流程概念(STEP);按照危害分析与关键控制点HACCP原理抽象出的7个概念:CCP(关键控制点)、HA、CL、CM、CA、VE、RE。

(2)概念实例化

将上述HACCP中的每个概念作为一个表格列,结合表 1的原始HACCP 计划表,可以得到对应每个概念下合理存在的实例如表2所示。表中每一行代表一个被选为关键控制点CCP的实例,除首行首列外的每个单元格代表一个列概念在当前行对应关键控制点上存在的所有实例。

(3)关系分析

关系是连接两个概念的“桥梁”,两个概念之间通过属性建立相连的关系。与关系相连的两个概念根据连接属性的作用方式分别定义为:主体和客体。主体表示触发该属性作用的概念,客体表示该属性作用的目标对象概念。这些连接属性构成概念的关系集,反映领域知识中概念之间的交互作用。

首先,以活牡蛎接收这一关键控制点流程为例,说明其中包含的主要关系,如表3所示。

表3 活牡蛎接收中的关系分析Tab.3 Relationship analysis in live oyster reception

对比表3,针对干法冷藏关键控制点流程还需在此基础上附加的关系如表4所示。

表4 干法冷藏的附加关系分析Tab.4 Additional relationship analysis of dry refrigeration

在3个控制点各自对应的关系分析外,还有涉及到两个关键控制点之间,为了更好地实现信息共享而有必要表达的关系如表5所示。

表5 两个流程之间的关系分析Tab.5 Analysis of relationship between two processes

(4)属性分析

概念不仅有相互之间的连接关系,还有属于自己的一些数据属性,比如在HACCP计划表中与时间、温度等有具体数据要求的概念。因此用数据属性描述概念主体与一些数据特征之间的关系,表现为主体和数据类型的关系,本质上也是一种关系。其中,主体表示该属性作用的对象概念,数据类型表示该属性值的取值约束。主要的数据属性如表6所示。

2.3 知识建模层

知识建模是知识推理和知识应用的基础。此处的知识建模主要是通过两方面建立本体知识模型:一是概念关系模型的构建,以理清领域知识核心概念间的关系;二是基于本体的规则的提取与表述,实现通过本体共享概念模型的明确形式化规范说明[28],通过本体建模工具,建立概念关系和规则,为知识推理提供前提条件。

表6 KRM-HACCP中的主要数据属性Tab.6 Main data attributes in KRM-HACCP

2.3.1概念关系建模

对2.2节中通过知识表示提取出的、面向一个关键控制点的相关概念,梳理这些概念间的相互关系,建立生食牡蛎CCP概念-关系(E-R)模型,如图2所示。图中矩形框表示概念,菱形框是概念间存在的关系。连接线上的数字代表连接基数,0表示所连接的概念中可以没有实例与对应概念的实例建立关系,1表示所连接的概念中实例与对应概念的实例之间建立一对一关系,n表示所连接的概念中最多有n个实例与对应概念的实例之间建立关系。

2.3.2规则建模

规则建模采用SWRL构造规则本体并通过本体之间的关联来获取更多的知识,即使用SWRL建立推理规则。推理规则是以目标为导向的推理条件的有机组合[29]。

对HACCP计划表达的知识作规则提取,可以更好地监控HACCP计划实施、保障产品质量、提供水产品追溯证明。基于上述HACCP计划知识表示基础,描述部分典型推理规则:

(1)流程记录类规则

这类规则与各关键控制点中的信息密切相关。以活牡蛎接收CCP为例,其中涉及到捕捞标识、捕捞许可证、捕捞时间等证明信息,为下一个CCP的实施提供前提条件,因此要将产生的证明信息进行验证,并拒收不符合条件的原材料,形成记录。为此,设计了如下规则。

Rule-1(记录验证规则):如果某CCP中实施了某项监控措施CM,且监控措施CM对关键限值CL进行监控,并由监控对象信息载体Proof进行记录和证明,则在CCP中需要提交产生的Proof供后续验证有效性。该规则描述为

Has_CM(?CCP,?CM),Monitor_CL(?CM,?CL),CL_proved_by(?CL,?Proof),Proof_from_CCP(?Proof,?CCP)→CCP_submit_proof(?CCP,?Proof)

Rule-2(监控记录规则):如果某CCP有某显著危害HA,实施了某项监控措施CM,CM对CL进行监控,对监控内容进行记录,监控信息可以用来检验某关键限值 CL,则在实例CCP中会产生记录RE,记录实例CCP中的接收记录。该规则描述为

Has_HA_risk(?CCP,?HA),Has_CM(?HA,?CM),Monitored_by(?CL,?CM),Has_RE(?CM,?RE),CL_proved_by(?CL,?CM)→CCP_generate_RE(?CCP,?RE)

Rule-3(有偏必纠规则):如果某CCP有某种显著危害HA,根据某显著危害有相应的预防措施的关键限值CL,由监控措施CM对关键限值CL实施监控,并由记录RE检验某纠偏措施CA,当显著危害超出关键限值的要求时,则在实例CCP 中产生纠偏行动的一个实例纠偏措施CA。该规则描述为

Has_HA_risk(?CCP,?HA),Has_CL (?HA,?CL),Monitored_by(?CL,?CM), CA_proved_by(?CA,?RE)→CCP_generate_CA(?CCP,?CA)

(2)数据共享类规则

这类规则主要与计划表中时间相关特征属性密切相关。比如,针对表1中活牡蛎接收CCP下的关键限值:“捕捞至冷藏的最长时间小于24 h”,即是要求在CCP1中有关起始时间的监控信息需共享给干法冷藏CCP2。为此,设计了如下规则。

Rule-4(数据共享规则):如果有实例 CCP1、CCP2,且在生食牡蛎业务流程中,CCP2是CCP1之后的实例,监控措施CM对实例CCP1的关键限值CL进行监控,且由监控对象信息载体Proof进行证明,那么在CCP1中需将关键限值CL向下一步传递。该规则描述为

Differentfrom(?CCP1,?CCP2),Next_CCP(?CCP1,?CCP2),Proof_from_CCP(?Proof,?CCP1),Monitored_by(?CL,?CM),CL_proved_by(?CL,?Proof)→CCP_deliver_CL(?CCP1,?CL)

其他,诸如“冷藏库温度不超过7.2℃的时间不大于2 h”,“产品从干法冷藏库移到牡蛎肉储藏间的时间不得超过3 h”等也可对应此规则,在此不再赘述。

(3)纠偏类规则

这类规则与各CCP中与温度相关的CL纠偏记录密切相关。比如,针对表1中干法冷藏CCP下的关键限值:“冷藏库温度不超过7.2℃的时间不大于2 h”,牡蛎肉储存 CCP下的关键限值:“冷藏库温度超过7.2℃的时间不大于2 h”,即需要严密监控冷藏库温度以便及时纠偏,并作出记录。为此,设计了如下规则。

Rule-5(纠偏记录规则):如果某CCP有某显著危害HA,各显著危害有某关键限值CL,监控措施CM对CL进行监控,监控措施CM由记录RE进行证明,若有误差则有纠偏措施CA,那么CA由记录RE进行证明,并记录其中。该规则描述为

Has_HA_risk(?CCP,?HA),Has_CL(?HA,?CL),Monitor_CL(?CM,?CL),CM_proved_by(?CM,?RE),Has_CA(?CM,?CA)→CA_proved_by(?CA,?RE)

同时设计了在各CCP中与温度相关的纠偏验证的规则。

Rule-6(纠偏验证规则):如果某CCP有某关键限值CL,CL由监控措施CM进行监控,并且CM由监控记录进行证明,如果发现不符合关键限值的要求,产生纠偏CA,并审查纠偏措施,则该纠偏措施会产生相关的验证信息VE。该规则描述为

Has_CL(?CCP,?CL),Monitor_CL (?CM,?CL),CM_proved_by(?CM,?RE),Has_CA(?CM,?CA)→CA_generate_VE(?CA,?VE)

2.4 知识推理层

知识推理层核心是实现HACCP规则的推理,继续丰富HACCP知识库的知识。推理系统的概念逻辑可抽象为图3,它由HACCP的基础知识库再加一个HACCP知识推理机组成[30]。

HACCP的基础知识库包括事实集合和规则集合。HACCP知识推理机由模式匹配、规则选择和规则执行3个组件构成。推理机的执行流程为:首先对输入的命题从语法层面作模式分析,匹配的模式进入规则选择环节,可以从HACCP基础知识库中去选择匹配度最高的规则,接下来执行该规则,执行后得到的结论进一步去丰富原始的事实集合。

结合实例,部分推理过程如图4所示。图中由6个圆角矩形分割出6个不同规则的条件实例关系和部分推理结果,其中 “Monitored_by-≡Monitor_CL”、“Proof_from_step-≡CCP_generate_proof”展现的是部分本体推理内容。

在“活牡蛎接收”中执行规则Rule-2,CCP1的一个显著危害点在于“致病菌生长”,为预防该危害的发生,“活牡蛎捕捞至冷藏的时间关键限值”规定该时间差小于24 h,由“捕捞时间监控”和“移到冷藏库的时间监控”两个监控内容对该关键限值进行监控,记录监控内容,若证明其差值未超出时间限制,该批牡蛎符合要求,则推出结论:“接收记录”,并在“活牡蛎接收”中产生该记录,形成CCP1中的一条实例。

规则Rule-3中推理条件与规则Rule-2类似,区别在于规则Rule-3推理条件中“活牡蛎捕捞至冷藏时间关键限值”不符合要求,则该规则推出的是在CCP1中产生“捕捞至冷藏时间纠偏措施”,拒收超出时间限制的牡蛎。图中菱形框内容并没有在本体编辑工具中实现,还需辅以外部应用来实现。

其他规则相关的推理过程与上述推理流程类似。

3 实验

将2.2节中通过HACCP计划表抽象出的概念、关系和实例,借助本体建模工具Protégé进行本体构建,实现概念关系建模以及规则建模。

在Protégé中通过Ontograf得到的图形化关系结构如图5所示。CCP概念和Step概念在具体实现中设置为两个等价概念。“OWL:Thing”代表定义的所有概念都是它的子概念。实线代表本体中的基本关系,虚线代表本体中的自定义关系,相同颜色的线条代表同一种关系。以 “CL”和“CM”为例,关键限值被监控内容监控,同时监控内容也监控关键限值,所以图中两个概念之间有两条自定义关系。概念具象化出的实例之间根据语义设置它们之间的关系,所以实例既存在自定义的关系,又存在基本关系。概念与概念,概念与实例之间通过2.3节所述关系联系在一起,这些联系是规则推理的基础。

在概念、关系建立的本体基础上,结合SWRL表达的规则,借助HermiT推理机进行本体推理和规则推理。以活牡蛎接收为例,部分推理结果及其分析如图6所示,其中推理①、②、③、④为本体推理结果,对应(1)、(2)、(3)、(4)推理过程,推理⑤、⑥、⑦为规则推理结果,对应(5)、(6)、(7)推理过程。

推理⑤、⑥、⑦是由规则推理得到的知识,根据规则Rule-1,在“活牡蛎接收”中,由“捕捞标识监控”监控“活牡蛎捕捞标识”关键限值,在监控过程中产生“捕捞标识”证明关键限值符合要求,则推出在CCP1中要提交监测信息以供后续CCP验证该批牡蛎符合要求。在规则推理过程中,包含部分由约束条件得到的本体推理结果。约束条件Proof_from_step-≡CCP_ generate_proof,得到推理②、③、④,即捕捞标识、捕捞许可证、捕捞时间标识等监测信息在CCP1中产生。因为“活牡蛎接收”为CCP的一个实例,CCP中存在约束条件“Equivalent to”Step,则得到推理①,即活牡蛎接收也是业务流程中的一个实例。Step这一等价实例的存在是为HACCP计划中关键控制点的动态调整预留的。

4 结论

(1)结合生食牡蛎HACCP质量体系,提取领域知识,保证了提取到影响质量安全的关键监控知识,以及HACCP原理知识,奠定了HACCP计划自动化应用的知识基础,也为可信溯源提供业务知识保证。

(2)结合生食牡蛎HACCP质量体系标准,设计规则,在增强语义描述能力的同时,实现了知识共享,使时间等相关信息在不同业务流程之间有效传递,从语义层面保障了业务约束的可控性。

(3)应用本体建模工具Protégé实现了本体构建,完成了 HACCP 计划的知识表达,借助HermiT推理机实现了知识推理,充实了HACCP基础知识库。

(4)生食牡蛎HACCP语义建模层次架构以及KRM-HACCP模型已完全具备知识描述能力、知识共享能力、知识语义推理能力以及知识发现能力。同时,该模型可以更系统、更完整地理解和表达HACCP计划语义。

猜你喜欢

牡蛎限值实例
法国培育出多口味牡蛎
链接:新GB1589出台后 货车尺寸限值有这些变化
2017年北京将实施“世界最严”锅炉排放标准
北京Ⅵ阶段重型发动机排放测试方法及限值对比分析
《轻型商用车辆燃料消耗量限值》强制性国家标准发布
昙石山文化的牡蛎器
完形填空Ⅱ
完形填空Ⅰ
《如何煮狼》:煮狼的女人爱牡蛎
牡蛎