APP下载

基于缺失数据估计的PLSS古建筑寿命预测

2016-02-27周福娜王佳瑜

计算机技术与发展 2016年6期
关键词:木构木结构样条

路 杨,吕 欣,周福娜,王佳瑜

(河南大学 计算机与信息工程学院,河南 开封 475004)

基于缺失数据估计的PLSS古建筑寿命预测

路 杨,吕 欣,周福娜,王佳瑜

(河南大学 计算机与信息工程学院,河南 开封 475004)

影响木结构古建筑寿命的因素主要包括物理、化学和生物等多个方面,且影响过程是错综复杂的。这些因素之间可能非线性相关,相应观测数据特征提取的完整性决定了其寿命预测的精确性。文中引入基于样条变换的偏最小二乘预测方法,在更高维空间中把非线性预测模型的建立问题转化为线性预测模型的建立问题实现木结构古建筑寿命预测。针对观测数据缺失情况下,基于样条变换的非线性偏最小二乘方法预测精度较低的问题,文中给出一种基于缺失数据估计的非线性偏最小二乘预测方法,以更充分地抽取可用观测数据的特征信息,并将其应用于木结构古建筑寿命预测中。仿真和实验验证结果表明了该方法的有效性。

数据缺失;样条变换;偏最小二乘回归;古建筑;寿命预测

0 引 言

木构古建筑是我国的历史见证之一,对了解历史、传承民族文化都有积极、深远的意义;充分反映我国的科技水平,且是不可再生资源,具有极高的社会、经济和文化价值。在历经岁月沧桑的保存过程中,由于人为的和自然力的破坏,木构古建筑都不同程度地遭受损害,甚至毁灭。科学准确地预测木构古建筑的使用寿命,对重大木结构的管理维护具有重要的意义[1]。由于影响木构古建筑寿命的因素众多,影响过程错综复杂,难以用准确的数学表达式来描述,所以研究基于数据特征抽取技术的寿命预测方法具有重要意义。

关于木构古建筑论文多是遗产保护[2]、测绘方法技术[3]、修缮方法[4],地震灾害[5]等。对木构古建筑寿命预测的算法较少,多集中于木结构累积损伤模型[6]、有限元分析模型[7]和BP神经网络[8]等。木结构累积损伤模型,由于结构的特点,技术问题较为复杂,目前各种技术标准和规范不能全部覆盖[9]。有限元分析,受到分析软件功能的限制,在选择单元属性以及屈服准则的时候,是不精确的[10]。集中在木构件自身的承受能力和结构特性。BP神经网络算法本质上为梯度下降法,且至今尚无一种统一而完整的理论指导,一般只能由经验选定,具有不确定性。这些算法均是建立在数据完整的基础上的。

文中引入基于样条变换的非线性偏最小二乘回归[11](Partial Least-Squares Splines,PLSS)方法,跳出了之前木构古建筑寿命预测的纯结构特性和力学特性,建立在数据基础上对木构古建筑寿命进行预测。木构古建筑所测数据是复杂的非线性关系,样条变换将所测数据的非线性问题转换为拟线性问题,既解决了所测数据间的非线性问题,又保留了偏最小二乘[12](Partial Least-Squares regression,PLS)算法的预报能力。木构古建筑由于传感器故障或离线维护,人为漏采集数据等造成数据缺失或不匹配等,坚持通过完整数据进行木构古建筑寿命预测,需要删除大量数据,不仅造成人力物力的严重浪费,而且预测结果具有较大预测误差。PLSS算法不能解决采集数据的缺失问题,为对缺失参数数据进行合理且有效的估计[13],并且科学地对木构古建筑寿命进行预测,文中提出一种基于缺失数据估计的PLSS预测方法并将其应用于木构古建筑寿命预测中,对采集数据中缺失数据进行估计,使采集数据得到充分利用,并且提高了寿命预测的准确度。

1 PLS与PLSS

1.1 PLS

自变量与因变量的数据表X=[x1,x2,…,xp]n×p和Y=[y1,y2,…,yq]n×q。PLS预测模型步骤为:

(1)

(2)

其中,p1=XTt1/‖t1‖2、r1=YTt1/‖t1‖2为负荷向量;X1、Y1为残差矩阵,将X1、Y1代替X、Y进行求解。

(3)

其中,k是通过交叉有效性确定的。

(4)

PLS算法[14]对具有线性关系的变量,具有很好的预测能力,但是木构古建筑变量间是复杂的非线性关系,PLS并不能很好地进行预测。

在我国的木构古建筑中存在大量梁柱式的木结构,最典型的有殿堂式木结构,这些结构的存在对研究我国的历史和建筑技术发展具有非常重要的意义。影响木构古建筑寿命的因素主要有荷载因素、环境因素、结构材料因素、力学因素、微生物等,其中选取最重要的影响因素—虫蛀面积率、腐朽深度、应力水平、虫蛀面积的均值及其变异系数和开裂深度的均值及其变异系数来进行寿命预测。木构古建筑寿命预测关注的质量指标仅有一个即剩余寿命,所以文中讨论q=1,p=6情况下的木构古建筑数据特征抽取和预测问题。

1.2 PLSS

在实际应用中,由于因变量和自变量之间的关系常常不是线性的,它们之间存在着复杂的非线性关系。传统的PLS仅适用于线性模型,实际应用中造成较大偏差。PLSS算法[15]是在PLS算法中加入样条变换,用分段拟合的思想构造样条函数,具有按需要裁剪以适应任意曲线连续变化的优点,样条函数具有光滑性、连续性。

Step1:采集自变量和因变量[X,Y],对自变量X进行样条变换,在高维空间中把非线性问题转化为拟线性问题。模型采用三次B样条函数作为变换基数。

(5)

其中,ξj,l-1为对变量xj划分所增加的插入点;hj为对变量xj划分的分段长度。

记变量xj的最小观测值为min(xj),最大观测值为max(xj),有

ξj,l-1=min(xj)+(l-1)hj

(6)

(7)

其中,Mj为对变量xj划分的分段个数。

全体自变量与因变量的非线性函数关系为:

PLSS预测是建立在数据完整的基础上的,数据有缺失的情况下预测精度较差。故文中提出基于缺失数据估计的PLSS预测算法。

2 基于缺失数据估计的PLSS预测

Step1:采集数据X0,其中缺失部分赋该列均值得数据X。

其中,负荷向量pi∈Rm×1;得分向量ti=Xpi,ti∈Rn×1。

(9)

记Zj=(zj,0,zj,1,…,zj,Mj+2),所得新的数据为[Z,Y]=[Z1,Z2,…,Zm,Y]。

Step5:对[Z,Y]=[Z1,Z2,…,Zm,Y]进行标准化处理,以去除量纲的影响。

(12)

(13)

得到

(14)

其中

(15)

从而可建立起Y关于X的非线性回归模型进行木构古建筑寿命预测。

(16)

图1为基于缺失数据估计的PLSS预测框图。在木构古建筑中每个木构件的寿命均对该建筑的寿命有影响,不能机械地删除其中任何一个部件的数据,或者是删除某一项寿命预测重要指标,所以对缺失数据的估计对木构古建筑寿命预测具有实践意义。

图1 基于缺失数据估计的PLSS预测流程图

3 仿真与实验分析

本节首先采用模拟数值仿真的基于缺失数据估计的PLSS算法,利用相对预测误差对文中的PLSS算法进行测试,然后利用实际采集数据的基于缺失数据估计的PLSS算法对木结构古建筑寿命进行预测。

3.1 数据仿真实验

首先采用模拟数值验证的基于缺失数据估计的PLSS算法,并利用相对预测误差衡量预测算法的精度。观测数据矩阵X=[x1,x2,x3]n×3和Y=[y]n×1,样本个数均为n=30。

x1=randn(n,1)

(17)

x2=randn(n,1)

(18)

(19)

(20)

x3中第21到30的数据缺失,对缺失数据进行估计,并对重构后的数据进行样条变换,对数据进行扩维。并对基于缺失数据估计的PLSS预测、基于PLSS删除缺失数据项模型预测、基于PLSS缺失值补0后做预测以及BP神经网络预测方法进行比较。

图2给出了不同预测方法的仿真结果。其中,横坐标表示预测样本,纵坐标表示样本对应的预测输出。

图2 不同预测方法的仿真结果

图2表明,基于缺失数据估计的PLSS预测相比其他算法与实际值更吻合。

表1给出了不同预测方法所得相对预测误差比较,其中相对预测误差通过式(21)定义。

(21)

表1 不同预测方法预测结果精度比较

表1表明,基于缺失数据估计的PLSS方法预测精度更高,预测值更接近于期望输出,且相对预测误差较小。

3.2 实验验证

本节采用历史建筑木结构殿堂式结构,采集到观测变量有6个,应力水平x1和腐朽深度x2、虫蛀面积的均值x3、变异系数x4和开裂深度的均值x5、变异系数x6[1]作为自变量X0=[x1,x2,…,x6];寿命预测年数作为因变量Y=[y1]n×1,如表2所示。

表2 实际采集数据

图3 不同预测方法的实测数据结果

图3表明,基于缺失数据估计的PLSS木构古建筑预测值相比较其他算法与实际寿命值更吻合。

表3给出几种不同预测算法的相对预测误差比较。

表3 实际采集数据预测方法精度比较

从表3中看出,基于缺失数据估计的PLSS方法对木构古建筑的寿命预测优于其他三种模型,预测值更接近于期望输出,预测精度更高。

4 结束语

木构古建筑实际采集数据存在数据缺失情况下,为了充分提取现有观测数据中的信息,建立了基于缺失数据估计的PLSS寿命预测方法来实现变量间非线性较强情况下的木构古建筑的寿命预测。经仿真测试或实验验证均表明了该方法的有效性,可以更好地为木构古建筑视情维护提供决策依据。

[1] 王雪亮.历史建筑木结构基于可靠度理论的剩余寿命评估方法研究[D].武汉:武汉理工大学,2008.

[2] 刘泽谦,付 宏,王 明.隆里古镇建筑文化遗产的保护与开发[J].产业与科技论坛,2015(12):242-243.

[3] 曹 勇.现代科技在古建筑测绘中的应用[J].现代物业:上旬刊,2011(3):54-56.

[4] 姜丛梅.结合古建筑修缮工程实例浅谈古建筑保护修缮方法[J].江苏建筑,2015(3):57-61.

[5] 周 乾,闫维明,杨小森,等.汶川地震导致的古建筑震害[J].文物保护与考古科学,2010,22(1):37-45.

[6] 王 阳,杨 娜.基于累积损伤理论的古木构件剩余寿命计算方法[J].北京交通大学学报:自然科学版,2015,39(1):45-51.

[7] 王 阳.殿堂式古建木构有限元分析与可靠度评估[D].北京:北京交通大学,2014.

[8] 路 杨,李鹏珊,翟盼盼.改进BP神经网络在木构古建筑中的寿命预测[J].计算机技术与发展,2014,24(5):207-210.

[9] 李 瑜.古建筑木构件基于累积损伤模型的剩余寿命评估[D].武汉:武汉理工大学,2008.

[10] 岳元元.清代徽派木结构古民居塑性有限元分析[J].安徽建筑,2015,22(3):143-145.

[11] 王惠文,吴载斌,孟 洁.偏最小二乘回归的线性与非线性方法[M].北京:国防工业出版社,2006:191-215.

[12] 王惠文.偏小二乘回归方法及应用[M].北京:国防工业出版社,1999:150-171.

[13]NelsonPRC,TaylorPA,MacGregorJF.MissingdatamethodsinPCAandPLS:scorecalculationswithincompleteobservations[J].ChemometricsandIntelligentLaboratorySystems,1996,35(1):45-65.

[14] 刘 强,尹 力.一种简化递推偏最小二乘建模算法及其应用[J].北京航空航天大学学报,2003,29(7):640-643.

[15] 吴晓华,陈德钊.化学计量学非线性偏最小二乘算法进展评述[J].分析化学,2004,32(4):534-540.

[16]MutekiK,MacGregorJF,UedaT.Estimationofmissingdatausinglatentvariablemethodswithauxiliaryinformation[J].ChemometricsandIntelligentLaboratorySystems,2004,781:41-50.

Prediction of Ancient Building Life for PLSS Based on Missing Data Estimation

LU Yang,LÜ Xin,ZHOU Fu-na,WANG Jia-yu

(School of Computer and Information Engineering,Henan University,Kaifeng 475004,China)

The factors that affect the life of the ancient building of the wood structure include many aspects,such as physical,chemical and biological factors,and the process of impact is complicated.These factors may be nonlinear correlation,and the completeness of the corresponding observation data feature extraction determines the accuracy of the life prediction.In this paper,the PLS based on spline transformation is introduced,and the problem of building the nonlinear model in higher dimensional space is transformed into it of building the linear model to realize the life prediction of wood structure.In order to estimate the accuracy of the nonlinear PLS method based on the case of the missing data,a nonlinear PLS prediction method is given based on the missing data estimation to extract the feature information of the available observation data more adequately and used in the life prediction of wood structures.Simulation and experimental verification results show the effectiveness of the proposed method.

data missing;spline transformation;Partial Least-Squares Regression (PLSS);ancient building;life prediction

2015-09-12

2015-12-16

时间:2016-05-25

国家自然科学基金资助项目(61203094,61174112);河南省高校科技创新人才支持计划(2012HASTIT005)

路 杨(1972-),女,博士,教授,研究方向为模式识别、数据挖掘;吕 欣(1987-),女,硕士研究生,研究方向为故障诊断。

http://www.cnki.net/kcms/detail/61.1450.TP.20160525.1706.034.html

TP301

A

1673-629X(2016)06-0195-05

10.3969/j.issn.1673-629X.2016.06.044

猜你喜欢

木构木结构样条
古建筑木结构保护技术在现代园林工程中的应用探讨
一元五次B样条拟插值研究
山西发现一口2000余年前的大型木构水井
木构的味道
山西蒙元仿木构墓葬文化特征研究
萨格勒布木结构观景塔
三次参数样条在机床高速高精加工中的应用
三次样条和二次删除相辅助的WASD神经网络与日本人口预测
基于样条函数的高精度电子秤设计
秦汉时期世界最大木构桥梁