APP下载

基于GSPN的计算机硬件系统可靠性分析

2017-12-12孔阳

中国科技纵横 2017年21期
关键词:可靠性分析

孔阳

摘 要:计算机的应用与普及改变了人们的生活方式,并且与其它技术相结合,对社会发展产生了重大影响。现如今计算机已经成为了人们生活的一部分,计算机功能的正常发挥需要相关方面为其提供支持与保障,而计算机硬件系统作为其功能实现的基础,需要做好维护工作。本文就基于GSPN的计算机硬件系统可靠性分析作简要阐述。

关键词:基于GSPN;计算机硬件系统;可靠性分析

中图分类号:TP303 文献标识码:A 文章编号:1671-2064(2017)21-0031-02

对计算机硬件系统动态特征进行准确的表述,依据传统的方法难以实现,因此需要通过其它方法来达成工作目标,对计算机在运行过程中其硬件系统变化进行准确的分析,基于GSPN对计算机的硬件系统进行可靠性分析,研究工作已经取得了一定成果。

1 可靠性问题产生原因

在计算机问世的时候可靠性问题就被提出,并且受到当时的技术与生产工艺条件的影响,正常运行的时间非常短,而随着技术发展,计算机运行可靠性有所增加,但是仍然会存在某些方面问题,对于计算机可靠性的要求可以从以下方面来论述其原因。

随着社会与技术的发展,计算机的功能在不断的完善,并且其复杂性有所提升,系统在运行过程中出错的概率相应的就会增加,因此需要对计算机采取一定措施降低其出错的概率。结合到当下社会环境,信息时代数据信息量大,并且对于数据处理结果方面的要求高,计算机作为关键设备需要确保其能够正常工作,某些关键岗位或者是部门一旦出现了问题就会造成难以预料的后果与损失。计算机工作的环境出现了变化,并且在某些情况下会受到湿度,温度,振动等方面影响。干扰因素的存在增大的计算机出错的可能性[1]。

2 可靠性概念及其它

可靠性是可信性在某一方面的属性,系统的可靠程度可以将其定义为在一定的工作时间下,处于规定的工作状态,规定的功能可以完成的概率。可靠度与失效元件存在一定的联系,元件的失效率可以将其分为三个阶段,失效率最高的是在最初阶段,其原因可能是在初期元件存在的缺陷与问题比较多,中间阶段将其称之为生存期,该阶段元件趋于稳定,而经过了该时期之后失效率又会迅速的增加,也可以将其称之为晚期失效期,三个不同的阶段可以用一条曲线来表示[2]。

从数学的角度来讲,系统可靠度是一个概率值,代表了系统平均使用寿命,并且对于不可维修或者是可以进行维修的系统来说,平均寿命的含义是存在区别的。系统的维修性则是表示在规定的条件下,依据规定的程序及方法应用从而使系统保持或者是恢复到到正常功能状态,对系统的可维修性进行评估时,通常应用的是平均维修时间与可维修度进行表述。

3 传统的可靠性评估方法

系统可靠性评估工作的方法包括了,故障树分析方法,事件树分析,二项式开展,可靠性框图分析,状态图分析等,不同的方法其依据的理论基础不同,分析问题的角度也会存在差异,所体现的优势与不足也有差别。

4 GSPN

4.1 GSPN相关定义及表述

从广义理论的层面,用八个元素组为基础定义随机Petri网,即GSPN=(P、T、I、O、H、M、W0、λ)。其中这些不同的字母其代表的含义也不相同,按照其排列先后顺序,各字母所代表的含义依次是:库所的全部有穷集合,变迁所有集合,输入弧有穷集合,输出弧有穷集合,禁止弧有穷集合,系统初始标识集合,弧权函数有穷集合,变迁集合对应于λ。

更详细的表述如下:在计算机工作的过程中,元素用法库所主要作用在于表述硬件系统的资源以及状态;瞬时变迁是用于表述硬件系统工作过程中运行逻辑与控制;时间变迁则是表述了硬件系统运转过程中不同的事件;有向弧则主要表述了计算机工作状态情况下的时间与工作状态的因果联系;在计算机硬件系统运行过程中,禁止弧表述的是运行逻辑与控制;标记则主要是用来表述硬件系统和行为的变化。

GSPN是近年随着Petri发展而产生的一种较新颖的分析方法,其主要针对的对象是系统性能。

4.2 硬件系统GSPN模型

库所结构中的参数含义分别表示为:计算机硬件系统运行状态正常时用P1标记,运行异常时用P2标记,存在临时性的故障用P3标记,系统硬件发生永久性故障用P4标记,计算机异常并且可自动恢复用P5标记,计算机存在故障且无法自动恢复用P6标记,这种情况下需要工作人员进行维修与检查[3]。

变迁含义的参数含义分别为:硬件系统运行阶段出现异常情况用T1标记,永久性的故障用T2标记,临时性的故障用T3標记,检查维护以后系统转入正常运转状态用T4标记,当发生故障时系统能自动恢复正常运转用T5标记,无法使系统进行自恢复功能则标记为T6,故障无法解决,故障已经发生了变化并且成为了永久性故障时用T7标记。综合计算机硬件系统的实际情况,分析得到模型的具体原理:在正常工作情况下,如果硬件系统的基本单元发生故障,并且其基本单元也出现异常,该异常情况是无法确定的,可能是永久性的故障,也可以是暂时性的。后者可以将其细分为两种工作状态,系统可以自动恢复至正常工作状态和无法自动恢复到正常工作状态。如果能够自动恢复,在系统基本单元下可以自行恢复,如果无法进行自动恢复,就需要人工维修从而找出问题所在并解决。对于永久性的故障而言,需要通过人工维修的方式从而使其恢复到正常的工作状态。

4.3 GSPN模型设计及硬件系统分析

简化假设主要是针对于较为关键模型分析而言的,对于这一类型的模型分析,工作需要依据流程开展,首先是对运行状态进行区分,判断其属于故障或者是正常的范围,之后假设硬件系统基本单元存在的故障均可以在λ基础上通过泊松过程实现,最后将所有硬件系统维修成功作为条件,使其处于维修率泊松过程中。从计算机硬件系统GSPN运作原理、作用分析,其作用是对计算机硬件系统的故障变化情况进行反馈,计算机运转在正常工作状态时用PW标记。硬件系统部分发生故障时用Pf来标记,由于某些因素产生了干扰使硬件系统的基本单元产生故障用Tf标记,Tr标记的故障情况可以通过一定的维修方式解决,之后系统可以恢复正常工作。endprint

建立模型后,模型中矩形表示计算机硬件系统发生了全局性故障,矩形Yi表示其故障的位置在第i个单元上,其中i=1、2、3。硬件系统基本单元如果出现了故障,那么则用圆形Xi表示,并且i=1、2、3,需要注意故障逻辑关系。可靠性分析则主要是通过模型达成目标,同时需要建立硬件系统GSPN分析模型。

4.4 可靠性测评方法建立

首先是建立模型,之后对状态图进行化简,依据化简的结果建立方程组。单工备份系统中,包含了备份备件与工作部件,代表部件的令牌在库所中的分布就代表了系统不同状态。GSPN共有四个库所,工作部件如果失效后就需要切换到备份部件,因此可以认为能够进行修理的部分是备份部件,同时考虑到瞬间转移存在,可以对状态图进行简化。分别表示部份部件与工作部件二者故障率,之后通过系统模型对系统的可靠程度进行求解。

依据系统GSPN模型可以得到系统可达树,将可达树的每一个节点看作是模型中的状态,就可以得到系统模型,此种方法可以将其称作是同构法。

如果为系统建立Markov模型,或者是将系统同构改成是该模型,当系统部件增加时,模型状态就会增加并且是呈现出指数状态,对于GSPN模型而言,当系统部件增加时,模型变化只是处所中的令牌数,模型转型,结构,处所都保持原有的状况不变。

以CPU模块的GSPN模型进行说明,假设库所pc中初始标记为3,其含义是有三个CPU在刚开始工作的时候处于正常工作状态,延时变迁则用来表述失效变迁这一过程,假设每个CPU模块失效的时间服从于一定参数的指数分布随机变量。因此变迁的点火率就依赖于库所PC中标记个数,当库所的标记个数出现变化时,点火率也会发生同样的变化。在不同的表决系统下,能够容忍失效的CPU数量是不同的,2/3表决系统,最多允许失效的CPU数量是1,当库所标记只有一个标记时则表明系统失效。库所中pec标记数则表示的是已经失效但是还没有通过检测的模块数量。模块失效后,可以分为两类情况,一类是可以通过系统检测机进行判断,而另一类则是不能通过系统检测机进行判断。由于系统自检与运行是保持同步的,因此就可以认为通过自检来判断模块数量是不需要给予单独时间的。库所PCD标记数则表示已经检测出故障,但是故障尚未能得到有效修理。如果模块的故障无法进行检测,就会进入到失效工作状态,失效的模块数则是通过pcf来表示,模块修理的过程用TCR来表示。假设CPU修理模块服从于某一参数的指数分布,并且可以同时对多个模块进行修理,则变迁trc点火率可以通过相应的表达式表示。

5 GSPN方法改进研究

在通过随机网定义了两种不同的转移,瞬间转移从选通到点火无需时间,随机延时转移这一过程中需要的时间则是一个随机变量并且服从指数分布。为了使随机Petri网对系统分析与计算的能力增强。在某些情况下,需要对点火延迟时间赋予分布函数,从而使建模的过程中与实际工作二者间更加相符。但是从另一外方面来考虑,该模型本来就具有一定的复杂性,分析与模拟的能力增加后,模型求解问题也会变得更加的复杂,因此在使用该模型对计算机系统进行评价时,点火的过程通常都将其假设为0,或者是利用随机函数,函数具指数分布,而此种做法又会与实际工作状况不符[4]。

后来在研究工作进行过程中,研究人员提出了具有延时的DSPN(deterministic and stochastic Petri nets)模型,该模型拥有三种类型转移,确定时延转移,无需时间的瞬时转移,随机进延转换。该模型与GSPN模型相比,其表述能力更强。但是由于其模型中存在确定时延转移,无法通过建立方程组的方法进行求解,模型虽然具有一定好处,但是无法利用其对实际问题进行求解,对于此类模型,求解工作通通常是利用仿真方法。对该模型的确定时延转移进行重构,从而获得能够逼近原有模型的GSPN模型。

6 结语

计算机及其相关技术与社会发展已经紧密的联系在一起,并且随着社会发展,计算机在生活中应用的范围将会更加扩大化,功能更加强大的同时,对于其可靠性的要求也会相应提升。可靠性可以从不同的方面多个角度衡量,但是其基本的前提是能够保证工作的正常开展。为了提升计算机硬件设施的可靠性就需要从影响到其可靠性的因素着手,从而使采用的措施具有针对性,以确保计算机能够更好的为社会发展进步服务。

参考文献

[1]谷春英,姚青山.基于GSPN的计算机硬件系统可靠性分析[J].微电子学与计算机,2013,(6):122-125.

[2]马进毅.基于GSPN的计算机硬件系统的可靠性研究[J].信息技术与信息化,2015,(8):145-146.

[3]李寧.基于GSPN的计算机硬件系统可靠性研究[J].电子制作,2015,(11z):31.

[4]陈静.试论计算机硬件系统维护原则与方法[J].科技与企业,2015,(4):113.endprint

猜你喜欢

可靠性分析
航空发动机叶片多重响应面法可靠性分析
航空发动机叶片多重响应面法可靠性分析
本溪市区主干交通线网规划总体思路
县级电网规划可靠性分析与应用
航空发动机叶片的极值响应面法可靠性分析
基于随机森林赋权和改进ELECTRE—Ⅲ方法的科技奖励评价研究