多变量回归方程在水泥28dd抗压强度预测的应用
2021-06-12张大鹏王军龙陶涛王坤
张大鹏,王军龙,陶涛,王坤
众所周知,水泥是一种重要的建筑材料,水泥的强度是评价水泥质量的重要指标。在GB 175《通用硅酸盐水泥》标准中,水泥的强度等级是以28d抗压强度来划分的,可见水泥28d抗压强度的重要性。在水泥生产过程中,如何预测和控制28d抗压强度是水泥企业质量工作的重点。
在T/CBMF 17-2017《水泥生产企业质量管理规程》7.3.4中明确指出,出厂水泥强度指标应根据出厂水泥品种和强度等级,分别建立水泥早期强度和实物水泥3d和28d强度的关系式。大部分水泥生产企业采用JC/T 738附录A中的《水泥28d抗压强度预测公式的建立方法》来建立水泥28d抗压强度预测的一元一次线性回归方程,但在实际生产过程当中,往往有可能出现两个或者更多个影响因素。我们可以尝试用Excel中的数据分析功能,计算出多变量的多元回归方程,对两种预测方法的优劣进行比较,选择适合本单位的方法。
1 原始数据选择
表1为P·O42.5R出磨水泥部分检验数据。
2 一元一次回归方程
2.1 用JC/T 738附录A中的方法求出一元一次回归方程(表2)
2.1.1 回归方程公式
表1 我公司某月P·O42.5R出磨水泥部分检验数据
表2 用JC/T 738附录A中的方法求出一元一次回归方程
R28——预测28d抗压强度,MPa
R3——水泥3d抗压强度,MPa
R28实i——第i个样品28天抗压强度,MPa
R3i——第i个样品3d抗压强度,MPa
a、b——待定系数
n——试验组数
r——相关系数
R30——新输入的3d抗压强度,MPa
R3i——确立预测常数时第i个水泥样品3d抗压强度值,MPa
SX——实验标准偏差
S——剩余标准偏差
2.1.2预测公式的可靠性
通过式(4)计算出相关系数r=0.55,相关系数≮0.75,但JC/T 738附录A中指出,单一强度时不作要求。同时,通过表2和式(5)计算标准偏差得出:S=1.23MPa,S28实=52.2MPa,S28实×7%=3.65MPa,即剩余标准偏差S不大于全部水泥样品实测28d抗压强度平均值的7.0%,说明了R28=0.78×R3+28.68预测公式的可靠性。
2.1.3预测结果的精度
设定某样品3d抗压强度为33.0MPa,代入式(1),预测R28预=54.42。按式(6)计算试验标准偏差SX=1.32MPa,则28d水泥强度预测结果有95%的概率在[(54.42-2×1.32)~(54.42+2×1.32)],即[51.79~57.05]。
2.2 用Excel中的数据分析功能求出多元一次回归方程
2.2.1 多变量回归方程
首先在Excel中打开表1中的原始数据,选择数据→数据分析→分析工具→回归→确定,然后在Y值输入区域选择28d抗压强度的所有实验数据;在X值输入区域选择烧失量、CaO、比表面积、3d抗压强度四项中的所有试验数据;选择标志、置信度选择95%。该组数据的回归统计见表3,回归分析见表4,回归系数见表5。
表3 回归统计
(1)X对Y的拟合程度
由表3可知,Multiple R(线性回归的系数)为0.756 936 666,线性回归系数的平方,即R Square(拟合系数)为0.572 953 116,当拟合系数R Square越接近1时,表明回归模型拟合情况越好。但当自变量多于一个时,我们更应关注Adjusted R Square(调整后的拟合系数),Adjusted R Square在回归模型中可抵消样本数量对R Square的影响。Adjusted R Square值越接近1,回归模型拟合情况越好,表3中Adjusted R Square为0.504 625 614,说明拟合程度一般。
(2)统计学概率
由表4可知,Significance F为0.000 196 217,考虑到原假设和备责假设,原假设:四个X和Y之间都没有关系;备责假设:四个X和Y之间至少有一个和Y是有关系的;这个判断按P<0.05为依据。0.000 196 217<0.05,说明X对Y的影响很显著。
表4 回归分析
(3)X与Y值相关的概率
P值即概率,在Excel数据分析里用P-value表示,一般以P<0.05为有统计学差异。由表5可知:
表5 回归系数
烧失量的P-value为0.018 941 6,<0.05
CaO的P-value为0.615 996 54,>0.05
比表面积的P-value为0.227 942 58,>0.05
3d抗压强度的P-value为0.000 555 62,<0.05
在以上四个变量中,烧失量和3d抗压强度的P-value<0.05,虽然该组数据的拟合程度和统计学概率相关性不错,但在单独变量对Y值的相关概率中,CaO和比表面积的P-value>0.05,说明只有烧失量和3d抗压强度X对Y有显著性的影响。
2.2.2 两变量回归方程
为保证变量系数之间的相互影响,我们舍弃CaO和比表面积后,重新进行两个变量的回归统计,回归统计、回归分析、回归系数分别见表6,表7、表8。
(1)X对Y的拟合程度
由表6可知,Multiple R(线性回归的系数)为0.722 73,R Square(拟合系数)为0.522 34,Adjusted R Square为0.486 96,拟合程度一般。
表6 回归统计
(2)统计学概率
由表7可知,Significance F为4.656 68E-05,这个判断依据仍为P<0.05。4.656 68E-05<0.05,说明X对Y的影响很显著。
表7 回归分析
(3)X与Y值相关的概率
P-value表示P值,一般以P<0.05为有统计学差异。由表8可知,烧失量的P值为0.001 645 54,3d抗压强度的P值为0.001 577 83,两个变量的P值均<0.05,说明两个变量X对Y有显著性的影响。
(4)回归方程
根据上述拟合程度和统计学概率相关性,表8中的Coefficients系数表达公式如下:
表8 回归系数
3 回归方程的偏差比较
由表9可知,式(1)预测值与实际28d抗压强度检测值差值的标准偏差为2.13MPa,式(8)的预测值与28d抗压强度检测值差值的标准偏差为2.08 MPa,2.08<2.13,说明式(8)预测的准确性要优于式(1),进而说明Excel数据分析功能预测28d抗压强度的方法更为准确。
表9 对本公司某月出厂水泥数据进行两个回归方程的预测比较
4 结语
因各公司熟料成分、混合材品种及掺量的不同,检验误差、检验水准α的选值不同,导致两种方法计算的实际检验结果和预测值之间标准偏差的差值也不同,根据数理统计学理论,在检验水准α选值相同的情况下,多变量回归方程的预测精准度优于单变量回归方程预测的精准度。