APP下载

主成分算法在数控机床主轴热误差补偿中的应用

2021-12-14魏新园陈雨尘苗恩铭冯旭刚潘巧生

光学精密工程 2021年11期
关键词:稳健性建模精度

魏新园,陈雨尘,苗恩铭,冯旭刚,潘巧生

(1. 安徽工业大学电气与信息工程学院,安徽马鞍山243032;2. 重庆理工大学 机械工程学院,重庆 400054;3. 合肥工业大学仪器科学与光电工程学院,安徽合肥230009)

1 引 言

随着机床朝着高精度、智能化、高速和高可靠性的方向发展,热误差对机床精度的影响逐渐占主导地位[1]。机床热误差是由于内外部热源变化导致零部件产生热变形,从而造成刀具与工件之间的相对位置发生变化[2]。对于机床热误差问题,一方面可以通过热源控制和结构设计减少零部件的热变形,即硬件预防法[3]。另一方面可以通过建立热误差关于温度的预测模型,对热误差进行预测和补偿,即软件补偿法[4]。软件补偿法以其成本低和易于实现等优点较常被采用,其核心理论技术包括热误差测量方法、建模理论和补偿技术。其中热误差建模算法是影响最终补偿效果的关键,所建立的热误差预测模型需要具有高预测精度和高稳健性[5]。

多元线性回归算法(Multiple Linear Regres⁃sion,MLR)[6]常用于建立热误差预测模型,并且建模精度随着模型阶次的增大而提高,但模型对其他批次实验的预测精度下降。常用的建模算法还有神经网络[7-8]、支持向量机[9-10]和时间序列[11-12]等;新的建模方法如无模型数据驱动建模方法[13]和无偏估计法[14]等。神经网络算法通过增加训练次数能够显著提高热误差建模精度,但需要大量的热误差样本数据,不利于在工程应用中推广。支持向量机算法在处理高维、非线性数据中具有显著优势,但算法较为复杂,对补偿控制器的性能要求较高。

此外由于机床内外部热源之间具有复杂的耦合关系[15],温度变量之间具有严重的多重共线性[16]问题,会进一步造成模型稳健性下降。因此在建模之前通常需要对用于建模的温度测点进行筛选,即温度敏感点(Temperature Sensitive Points,TSP)选择[17]。模糊聚类结合灰色关联算法(Fuzzy clustering combined with grey correla⁃tion algorithm,FCGC)[18]常用于 TSP 选择,该算法首先对温度测点进行分类以降低温度测点之间共线性的影响,然后从每一类中选择与热误差相关性最大的温度测点作为TSP。按照这一思想,有学者提出粗糙集理论结合灰色关联度算法[19]和模糊聚类结合相关系数算法[20]等 TSP 选择算法。同时有学者基于其它思路进行TSP 选择,Tan et al. 提出一种基于包装机器方法的TSP 选择算法[21];Fu et al. 提出一种将机床划分为不同区域,进而从不同区域中选择全局最优TSP 的方法[22]。

主成分回归(Principle Component Regres⁃sion,PCR)[23-24]、岭回归[25]和偏最小二乘[26]等偏回归算法自身能够有效抑制自变量间多重共线性的影响,有学者使用这些算法建立热误差预测模型,并取得了较好的预测效果。但存在的问题是当外部环境温度变化较大时,模型的稳健性难以得到保证。对此,本文对全年范围内的机床主轴热误差数据进行分析,提出了基于主成分分析(Principal Component Analysis,PCA)的热误差稳健建模算法。该算法不再对温度变量进行分类,而是直接基于PCA 选择对热误差影响权重大的温度变量作为TSP,以保证参与建模的温度变量中包含充分的温度信息。进而使用PCR 算法建立热误差预测模型,以消除TSP 之间共线性对建模效果的影响。本文以一台三轴立式加工中心为对象,通过实验研究分析了本文所提建模算法中TSP 个数对建模效果的影响规律,从而确定最佳的TSP 个数。然后根据TSP 选择结果建立相应的热误差PCR 模型,并将所建立的PCR 模型与多元线性回归模型、BP 神经网络模型和岭回归模型进行预测效果比对分析。最后,使用所建立的PCR 模型对按照转速图谱运行的机床主轴热误差进行预测,并将PCR 模型嵌入到热误差补偿控制器中进行热误差补偿实验,以验证本文建模算法的有效性。实验结果表明,本文所提基于PCA 的机床主轴稳健建模算法具有高预测精度和高稳健性。本文的研究对于机床主轴热误差建模和补偿具有重要的理论价值和实际工程意义。

2 主成分建模算法

首先介绍主成分算法基本原理,进而提出基于PCA 的TSP 选择算法,并分析热误差PCR 建模算法。

2.1 PCA 基本原理

PCA 是一种常用的降维算法,该算法可以使用少数不相关的变量,即主成分,取代原有多个相关性较高的变量。设原始数据p个变量x1,x2,…,xp的样本观测值为X1,X2,…,Xp,其中Xi=(xi1,xi2,…,xiN)T,i=1,2,…p,N为样本点个数。则主成分Zi可表示为:

其中,对于每一个i值,需要满足三个条件:①②maxVar(Zi);③Zi相互正交。

2.2 基于 PCA 的 TSP 选择

基于上述基本原理,本文提出一种基于PCA的TSP 选择算法。该算法首先选择出贡献率最低的主成分,然后将该主成分中系数绝对值最大的一个变量剔除,因为该变量对该主成分贡献率低的影响作用最大。之后对剩余变量进行PCA,并重复上述剔除过程,直至剩余的变量个数满足TSP 个数要求。这种逐步剔除变量的做法可以保证剩余温度变量中包含有效的温度信息,从而简化模型结构并提高稳健性。本文没有直接选择贡献率最高的主成分中系数绝对值最大的变量作为温度敏感点,原因在于其余主成分中可能同样包含重要的温度信息,其中的变量可能同样具有较大的影响权重。如果只从贡献率最高的主成分选择TSP,有可能出现漏选的情况。基于PCA 的TSP 选择具体步骤如下:

(1)首先将原始数据 X=(x1,x2,…,xk)标准化得到标准化公式为:

(2)根据原始数据 X=(x1,x2…xk)的相关矩阵R=(ρij)k×k的特征值λi和相应的特征向量,求得主成分Zi:

其 中 ,e∙i=[e1i,e2i…eki]T为 相 关 矩 阵R的 特 征向量。

(3)计算出每个主成分的贡献率,选择贡献率最小的一个主成分。第i个主成分的贡献率Vi为:

其中,λi为相关矩阵R的特征值。从上式中可以看出主成分贡献率的大小是由特征值决定的。

(4)在贡献率最小的一个主成分中,选择对该主成分占最大权重的变量,即模型系数绝对值最大的变量。设贡献率最小的主成分为Zi,则从Zi的表达式中,挑选出绝对值最大的eji所对应的变量,然后把第j个变量剔除。其中:i,j,k分别表示主成分序号、自变量序号和自变量的个数。

(5)使用剔除之后的变量数据,重复步骤(1)~(4),直至剩余的变量个数为要求的TSP 个数,即完成TSP 选择。

2.3 基于PCR 的热误差建模算法

机床热误差数据与温度数据之间不存在数量级上的差别,因此本文提出使用原始数据的协方差矩阵计算主成分。这样能够避免使用相关矩阵计算主成分时,原始数据间的真实离散程度丢失。算法具体步骤如下:

(1)计算原始数据 X=(x1,x2,…,xk)的协方差矩阵Q=(covij)k×k,进而计算其特征值和相应的特征向量,可求得主成分Zi如式(5)所示。

其中,eij为协方差矩阵Q的特征向量

(2)根据累积贡献率选择主成分。第i个主成分的贡献率Vi如式(4)所示,将主成分按照贡献率降序排列。累积贡献率Vg指前g个主成分贡献率的求和。通常选取Vg大于85%的主成分,本文中为了避免数据信息丢失选取Vg大于95%的主成分。

(3)建立因变量y 与所选主成分的回归模型:

(4)将式(5)带入回归方程式(6)中得到原始数据(x1,x2…xk)与因变量y之间的方程式:

其中,常数项b0通过下式计算得到:

上述步骤没有对原始数据进行标准化处理,因此在建立热误差关于主成分的回归模型后,不需要进行标准化还原。

3 热误差测量实验

3.1 实验装置

本文以一台Vcenter-55 型号的三轴立式加工中心为实验对象进行热误差测量实验,机床实物如图1 所示。

图1 实验对象:三轴立式加工中心Fig.1 Experimental object:three axis vertical mechining center

热误差测量参考国际标准《机床检验通则第3 部分:热效应的确定》(ISO 230-3:2020)[27],使用五点测量法。在X、Y 和Z 三个方向分别使用2个、2 个和 1 个测量精度为 1 μm 的高精度电容位移传感器,如图2 所示。

图2 位移传感器位置Fig.2 Position of displacement sensor

图2 中T1~T9 为同步测量机床9 处关键位置温度信息的铂电阻温度传感器,测量精度为0.1 ℃。T10 没有在图中画出,位于机床外壳上测量环境温度。10 个温度传感器安放位置及作用如表1 所示。

表1 温度传感器位置及作用Tab.1 Position and function of temperature sensor

3.2 实验安排

在每批次实验过程中机床主轴以恒定转速空转,工作台沿X,Y轴向以恒定进给速度往返运行,每运行5 min 测量并保存一次热误差和温度数据,整个实验过程不低于6 h。本文在全年时间内不同环境温度下,共进行9 批次热误差测量实验,记为K1-K9,各批次实验参数如表2 所示。其中主轴转速设定为 2 000,4 000 和 6 000 r·min-1三种不同转速。由于本文主要对机床主轴热误差进行研究,而工作台进给速度对机床主轴热误差规律影响较小,因此本文在实验过程中选取一个常用的工作台进给速度进行实验,即进给速度设定为1 500 mm·min-1。

表2 各批次实验参数Tab.2 Experimental parameters of each batch

3.3 实验数据分析

经过统计,以上各批次实验的初始环境温度分布范围为2.94~32.37 ℃,说明全年环境温度范围较大。对实验数据进一步处理分析,可绘制出各批次实验的热误差变化曲线和温度变化曲线,图 3 和 图 4 为 K1 与 K9 批次实 验 的 10 个 关 键位置的温度变化曲线。

图3 K1 批次实验温度变化曲线Fig.3 Temperature curve of K1

图4 K9 批次实验温度变化曲线Fig.4 Temperature curve of K9

同理可绘制出9 批次实验的Z 向热误差变化曲线,如图5 所示,从图中可观察出,不同环境温度下机床热误差变化规律存在明显差别。

图5 各批次数据Z 向热误差变化曲线Fig.5 Thermal errors in Z direction curves of each exper⁃iment

4 基于主成分的热误差模型建立

根据前面介绍的热误差建模算法,对9 批次热误差数据进行建模分析。首先筛选TSP,然后建立热误差PCR 模型,进而分析最佳的TSP个数。

4.1 TSP 选择

以选择2 个TSP 为例介绍基于PCA 的TSP选择过程。如计算K1 批次实验10 个温度变量的主成分,其贡献率如表3 所示。

表3 K1 批次各主成分及贡献率Tab.3 Principal components and contribution rate of K1

表3 中各主成分是按照贡献率降序排列后的结果,即Z10贡献率最低。因此应该首先根据Z10中的变量系数大小来剔除温度变量。Z10表达式为:

由式(9)可知Z10中变量x10的系数绝对值最大,因此剔除温度变量T10。然后从剩余的9 个温度测点数据中重复上述主成分计算和剔除变量的过程,直至剩余2 个温度变量,即为选择的TSP。上述过程可通过MATLAB 软件编程实现,经过计算可得K1~K9 各批次数据的TSP 选择结果,如表4 所示。

表4 各批次实验TSP 选择结果(PCA)Tab.4 Selection results of TSPs of each experiment(PCA)

4.2 PCR 模型的建立

使用所选择的TSP 建立热误差PCR 模型,仍以K1 批次数据为例进行介绍。由表4 可知K1批次数据的TSP 为T1,T7,即建模自变量为ΔT1,ΔT7。根据建模变量的协方差矩阵Q 可得主成分Z1和Z2分别为:

该两个主成分的贡献率分别为99.88%和0.12%,因此选取第一个主成分Z1用于建立热误差变量y1关于主成分Z1的回归方程:

将式(10)中第一式代入式(11)中,并进一步计算可得原始数据y1关于ΔT1,ΔT7的回归方程:

同理可计算得到K2~K7 批次数据的主成分归模型,不再详细介绍。

4.3 最佳TSP 个数分析

以上的建模分析是以选择2 个TSP 为前提的,实际上TSP 个数也会对模型的预测效果产生影响。因此下面基于实验数据分析TSP 个数对模型预测效果的影响规律,从而确定最佳的TSP个数。

使用K1~K9 批次数据分别选择1-10 个TSP,并建立相应的PCR 模型,进而对其它各批次数据分别进行预测。模型对单一批次数据的预测效果使用预测残余标准差S表示,计算公式为:

其中:yk为热误差数据点为对应的回归模型热误差预测值。

使用模型对其他批次数据的预测残余标准差的平均值Smean和标准差Sstd,分别表征模型的预测精度和稳健性,计算公式分别为:

式(14)和(15)中Si为公式(13)计算的模型对Ki批次数据的预测残余标准差,K=9 为数据批次。将不同批次所建模型的预测效果取平均值,得到不同TSP 个数下模型的预测效果。使用K1~K9 批次数据计算得到不同TSP 个数下的建模效果如图6 所示。

图6 TSP 个数对模型预测效果的影响Fig. 6 The influence of the number of TSPs on the pre⁃diction effect of the model

由图6 可以观察出,随着TSP 个数的增加模型预测精度有所下降,但稳健性逐渐提高。为了平衡模型的预测精度与稳健性,本文选用4 个TSP 建立热误差 PCR 模型。

5 模型预测效果分析

为了验证本文所提PCR 建模算法的有效性,本文使用FCGC 算法选择TSP,并分别使用MLR、BP 神经网络和岭回归算法建立热误差模型。进而比对分析三种热误差模型与PCR 模型的建模预测效果。

5.1 比对模型的建立

按照文献[22]中建模过程,使用 FCGC 筛选 2个TSP,各批次数据的TSP 选择结果如表5所示。

表5 各批次实验TSP 选择结果(FCGC)Tab.5 Selection results of TSPs of each experiment(FC⁃GC)

基于表5 中TSP 选择结果,进一步建立热误差关于TSP 的MLR 模型,模型系数如表6所示。

表6 各批次实验MLR 模型系数Tab.6 Model coefficient of MLR of each batch experi⁃ment

同时根据BP 神经网络算法使用上述各批次热误差实验数据,建立BP 神经网络热误差模型。所建立的BP 神经网络结构如图7 所示,转移函数选择线性转移函数。

图7 BP 神经网络结构Fig.7 Structure of BP neural network

BP 神经网络结构设为输入层、隐藏层和输出层,每层节点数分别设定为2 个,3 个和1 个。输入层两个节点代表2 个TSP 变量,输出层1 个节点代表主轴Z 向热误差变量。基于实验数据对BP 神经网络进行训练,得到各节点的权值和阈值,完成BP 神经网络热误差预测模型的建立。

同理根据表5 中TSP 选择结果,可分别建立各批次数据的岭回归预测模型,模型系数如表7所示。

表7 各批次实验岭回归模型系数Tab.7 Model coefficient of ridge regression of each batch experiment

5.2 建模效果比对分析

使用上一小节所建立的MLR 模型、BP 神经网络模型、岭回归模型分别对其他各批次数据进行预测。同时使用本文所提的PCR 建模算法,选择4 个TSP 并建立热误差预测模型,并对其他各批次进行预测。四种建模算法对其他各批次数据的拟合精度和预测精度使用公式(13)和(14)计算,其中拟合精度即为建模数据对自身进行预测的预测精度。进而根据公式(15)计算模型的稳健性。

从而得到各批次数据所建模型的拟合精度、预测精度和稳健性,结果分别如图8~10 所示。

图8 四种建模算法拟合精度结果Fig.8 Fitting accuracy results of four modeling algo⁃rithms

图9 四种建模算法预测精度结果Fig.9 Prediction accuracy results of four modeling algo⁃rithms

图10 四种建模算法稳健性结果Fig.10 Robustness results of four modeling algorithms

通过对比各模型的预测结果可知,BP 神经网络模型的拟合精度最高,但模型的预测精度和稳健性较差。PCR 模型的拟合精度最低,但预测精度和稳健性最高。MLR 预测模型的拟合精度低于BP 神经网络,但预测精度和稳健性高于BP神经网络。岭回归预测模型相比MLR 和BP 模型具有较高的预测精度和稳健性,但低于PCR 模型。经过计算得到PCR 算法的预测精度和稳健性 分 别 达 到 6.8 μm 和 2.4 μm,相 较 于 常 用 的MLR 算法,模型的预测精度和稳健性分别提升了23.4%和57.7%。通过分析可知,若模型对数据的拟合精度过高,则其预测精度和稳健性会下降。这是由于过高的拟合精度会造成所建立的模型较为敏感,容易受到外部环境变化的干扰,从而对其他批次数据的预测精度和稳健性下降。

5.3 实验验证

为了进一步说明本文所建PCR 模型具有高预测精度和高稳健性,本文参考国际标准[27]的转速图谱,进行了3 批次验证实验,记为V1~V3。国际标准中转速图谱选择的转速分别为最高转速的25%,50%,75%和100%。本文中最大主轴转速设定为6 000 r·min-1,则验证实验中不同主轴转速分别为1 500,3 000,4 500和6 000 r·min-1。三批次验证实验的转速图谱如图11 所示,其中每种转速持续15 min。V1~V3 批次验证实验的环境温度在25.6~26.8 ℃范围内变化。

图11 验证实验V1~V3 主轴转速设定Fig.11 Verification experiment V1~V3 spindle speed setting

使用本文所建立PCR 模型对3 批次验证实验进行预测,如对使用K1 批次数据建立的热误差模型对V1 批次数据进行预测,预测结果如图12 所示。

图12 K1 实验所建模型对V1 的预测结果曲线Fig.12 The curve of V1 predicted by K1 model

观察图12 可知,本文所建立的PCR 模型能够有效对按照转速图谱运行的机床主轴热误差进行预测。根据计算各批次数据所建立模型对V1~V3 验证实验的预测精度为6.12 μm,稳健性为3.43 μm。由此验证了本文所建立PCR 模型具有高预测精度和高稳健性。

将根据K1 批次实验所建立的PCR 热误差模型嵌入到热误差补偿控制器后,进行机床主轴热误差测量实验。热误差补偿控制器的原理[28]是使用数控系统坐标原点偏移功能,根据热误差实时预测值实现坐标原点的反向调整,以抵消热误差对机床精度的影响。实验过程中主轴转速设为6 000 r·min-1,工作台进给速度为1 500 mm·min-1。在实验开始2 h 后开启热误差补偿功能,以比对补偿前后热误差情况。热误差测量结果如图13 所示。

图13 热误差补偿测量结果Fig.13 Thermal error compensation measurement results

由图13 可知,补偿前热误差逐步升高,补偿后的热误差在-1~+5 μm 范围内。从而验证了本文所建立的热误差预测模型能够有效补偿机床热误差。

6 结 论

本文提出了基于PCA 的TSP 选择算法和热误差建模算法,并进一步建立了主轴热误差PCR模型。实验验证表明,本文所建立的机床主轴热误差预测模型在预测精度和稳健性方面优于MLR 算法、BP 神经网络算法和岭回归算法。根据计算,本文所提建模算法对2.94~32.37 ℃环境温度范围内的实验数据,预测精度和稳健性较MLR 算法分别提升了23.4%和57.7%。将建立的PCR 模型对不同主轴转速谱下的机床热误差进行预测,预测精度和稳健性均较高,并且实际热误差补偿效果较好。本文所提PCR 机床主轴热误差稳健建模算法具有重要理论意义和工程应用价值。

猜你喜欢

稳健性建模精度
联想等效,拓展建模——以“带电小球在等效场中做圆周运动”为例
会计稳健性的定义和计量
基于PSS/E的风电场建模与动态分析
不对称半桥变换器的建模与仿真
基于DSPIC33F微处理器的采集精度的提高
会计稳健性的文献综述
GPS/GLONASS/BDS组合PPP精度分析
货币政策、会计稳健性与银行信贷关系探析
Effect of Ammonia on the Performance of Catalysts for Selective Hydrogenation of 1-Methylnaphthalene
改进的Goldschmidt双精度浮点除法器