APP下载

非线性逐步回归在颜色与质量浓度辨识中的应用

2018-09-11丁学利曹文康李玉叶

关键词:参数估计读数乘法

丁学利 曹文康 李玉叶

(1.阜阳职业技术学院基础教学部,安徽 阜阳 236031;2.赤峰学院数学与统计学院,内蒙古 赤峰 024000)

颜色与质量浓度辨识的方法目前常用的是比色法[1],即把待测物质制备成溶液后滴在特定的白色试纸表面,等其充分反应后获得1张有颜色的试纸,再把该颜色试纸与标准比色卡进行对比,就可以确定待测物质的质量浓度档位。由于每个人对颜色的敏感差异和观测误差,使得这一方法在精度上受到很大影响。随着照相技术和颜色分辨率的提高,希望建立颜色读数和质量浓度的数学模型,即只要输入照片中的颜色读数即可获得待测物质的质量浓度。颜色读数和质量浓度的关系一般是多元非线性关系,如何建立它们之间的数量关系成为该问题研究的重点。多数研究利用多项式拟合、多元非线性回归、差值分析和主成分分析等方法建立数学模型[2-6]。

此次研究以2017年“高教社杯”全国大学生数学建模竞赛C题[7]为例,运用相关性分析和多元非线性逐步回归分析方法,通过逐步剔除最不显著变量,建立最优的质量浓度与颜色读数的数学模型。利用该模型可以较好地建立颜色读数和质量浓度的数量关系,也为实际的质量浓度辨识问题提供理论参考。

1 数据处理与分析

SO2质量浓度和物质颜色读数的原始数据,如表1所示[7]。表1中的变量B、G、R、H、S的含义依次为:蓝色颜色值、绿色颜色值、红色颜色值、色调、饱和度。

为了分析SO2质量浓度与颜色读数之间的关系,对其进行相关性分析。表2是SO2质量浓度与物质颜色读数的相关系数。从表2可看出,SO2质量浓度与B、G、R和H的相关系数的绝对值较大,与S的相关系数的绝对值稍小,但S的作用不能忽略。因此认为SO2质量浓度受B、G、R、S和H等5个变量的影响。

2 模型的建立及修正

2.1 模型I的建立与求解

根据SO2质量浓度和颜色读数的相关性分析,初步考虑建立五元线性回归模型,称为模型I,表达式为:

y=c0+c1x1+c2x2+c3x3+c4x4+c5x5+ε

(1)

式中:x1——蓝色颜色值(B);

x2——绿色颜色值(G);

x3——红色颜色值(R);

x4——色调(H);

x5——饱和度(S);

y——SO2质量浓度;

c0,c1,c2,c3,c4,c5——回归系数;

ε——随机误差变量。

表1 SO2质量浓度与物质颜色读数的原始数据

表2 SO2质量浓度与颜色读数的相关系数

利用EViews软件,采用最小二乘法对模型I进行计算,参数估计见表3,方差分析见表4。

表3 模型I最小二乘法参数估计

2.2 模型I的检验及修正

2.3 模型II的建立与求解

从图1可看出,虽然模型I通过逐步回归后各变量明显显著了,但拟合效果较差,说明SO2质量浓度与各颜色读数之间不是简单的线性关系,因此考虑建立五元完全二次多项式回归模型,称其为模型II:

表4 模型I最小二乘法方差分析

表5 模型I剔除不显著变量后的参数估计

(2)

式中,b0、b1、b2、b3、b4、b5、bjk(j≥1,k≤5)为回归系数。通过如下变换,可将式(2)的非线性问题转化成线性问题来求解。

令z1=x1;z2=x2;z3=x3;z4=x4;z5=x5;

z12=x1x2;z13=x1x3;z14=x1x4;z15=x1x5;

z23=x2x3;z24=x2x4;z25=x2x5;z34=x3x4;

z35=x3x5;z45=x4x5;z11=x1x1;z22=x2x2;

z33=x3x3;z44=x4x4;z55=x5x5。

变换后的方程为:

(3)

利用EViews求解模型II,结果如表7、8所示。

表6 模型I剔除不显著变量后的方差分析

图1 逐步回归拟合曲线

下面将这些最不显著项z2、z12、z13和z24依次去掉,作逐步回归[8-9]分析,得到逐步回归后的参数估计和方差分析,如表9、10所示。

表7 模型II最小二乘法参数估计

表8 模型II最小二乘法方差分析

从表9可看出,剔除变量z2、z12、z13、z24后,回归方程的每一项均在显著性水平0.05以下,p均小于0.05,说明每一项均是显著的。表10中的F统计量明显大于表8中的F统计量,说明通过逐步回归后的模型优于逐步回归之前的模型。

为了进一步检验逐步回归后的模型是否存在异方差,对逐步回归后的模型进行White检验[10]。构造辅助函数式(4):

(4)

式中:E——残差;

γ0,γ1,γ2——回归系数;

ε——随机误差项。

辅助回归估计结果如下:

(5)

根据非线性逐步回归分析后的模型可得到原始数据散点和逐步回归后的拟合图,如图2所示。从图2可看出,非线性逐步回归分析后的模型拟合效果较好。

表9 模型II剔除不显著变量后的参数估计

图2 非线性逐步回归拟合曲线

3 结 语

依据SO2质量浓度与颜色读数,先后建立五元线性回归模型和五元非线性回归模型,并不断检验和修正SO2质量浓度与颜色读数间的回归关系。通过变换将非线性回归模型转化成线性回归模型,再对变换后的线性回归模型作逐步回归分析,剔除不显著变量,最终得到最优的非线性回归模型。对比分析知非线性逐步回归模型拟合效果较好,且不存在异方差性,因此该模型具有较好的实用价值。但是,此次只研究了SO2质量浓度与各颜色读数之间的多元非线性回归模型,还可进一步研究SO2质量浓度与单个颜色读数之间的相关关系。

表10 模型II剔除不显著变量后的方差分析

猜你喜欢

参数估计读数乘法
算乘法
基于新型DFrFT的LFM信号参数估计算法
我们一起来学习“乘法的初步认识”
一种GTD模型参数估计的改进2D-TLS-ESPRIT算法
《整式的乘法与因式分解》巩固练习
把加法变成乘法
读数
读数
读数
读数