APP下载

动态光散射颗粒分布软测量

2016-12-19田慧欣朱新军

光学精密工程 2016年11期
关键词:演算法学习机峰值

田慧欣,彭 晓,朱新军,孟 博

(1.天津工业大学 电气工程与自动化学院,天津 300387;2.天津工业大学 电工电能新技术天津重点实验室,天津 300387)



动态光散射颗粒分布软测量

田慧欣*,彭 晓,朱新军,孟 博

(1.天津工业大学 电气工程与自动化学院,天津 300387;2.天津工业大学 电工电能新技术天津重点实验室,天津 300387)

考虑传统动态光散射颗粒粒度分布测量用的反演算法复杂、精度不够、抗噪能力差, 本文基于大数据思想,提出了一种动态光散射颗粒分布软测量方法。该方法通过调节颗粒粒度分布形状参数获得大量自相关函数及其对应颗粒分布的数据;使用这些数据对子学习机进行训练。最后,针对训练数据维数较高的特点对传统Bagging算法进行改进,并利用改进的Bagging集成算法集成子学习机以提高软测量模型的精度及泛化能力。通过模拟单峰数据和对300 nm标准粒径进行软测量开展了验证实验。结果表明,该方法能够较好地测量出不同动态光散射颗粒分布的峰值及分布宽度,模拟单峰数据测量峰值精度可达1 nm,300 nm和503 nm,标准粒径测量精度分别可达3 nm和4 nm,优于一般的反演算法。该软测量方法为动态光散射颗粒分布测量开辟了新的途径。

动态光散射;颗粒分布测量;软测量;Bagging算法

1 引 言

亚微米颗粒以及纳米颗粒在电、磁、光、热、声等各个方面都有其特殊性。随着新材料工业生产的迅猛发展,纳米颗粒由于具有表面效应和宏观量子隧道等特点,其应用也日益增多[1-2]。此外,在动态的乳胶聚合过程中以及对DNA、细胞等特性研究中,纳米颗粒的自身粒径也会给实验结果带来较大影响[3]。通常用来表征纳米颗粒性能的参数是粒度的大小及其粒度分布。对同质纳米而言,不同的颗粒大小或是不同的颗粒分布都将影响到其特异性能[4]。因此,颗粒粒度及其分布的精准测量对于实际应用具有重要意义。

动态光散射技术是测量亚微米颗粒及纳米颗粒粒度分布的主要测量技术。该技术采用密封测量的方式,不会破坏和干扰样品的原有状态,具有快速、便捷、可靠以及非侵入性等特点,在生物、化学和高分子材料等领域应用广泛[5]。动态光散射技术一般通过散射光相关函数反演求解的方法来获取颗粒粒度分布。在反演求解第一类Fredholm积分方程过程中,相关函数的测量需在无噪声的环境下进行,在数据的运算中也应尽量避免舍入误差的存在。但求解此类积分方程属于一个不适定病态数学问题,数据中一个微小的扰动都极有可能产生巨大误差,从而无法得到准确的颗粒粒度分布,使测量失去意义。因此,找寻最接近于真实粒度分布的反演算法是动态光散射技术中的重难点问题。针对上述问题,近些年来学者们提出了多种反演算法,其中被广泛使用的有累积法、指数法和非负约束最小二乘法,但这些方法对宽峰数据的分布测量效果较差,而CONTIN以及贝叶斯算法[6-9]等对不同颗粒的测量效果不同,算法稳定性有待提高。为了提高反演算法的精度,王静雅等结合Tikhonov正则化与瀑布型多重网格技术将原反演问题分解到多尺度网格空间,以降低求解难度[10],曹丽霞等改进Chahine算法以提高反演结果的平滑性及稳定性[11]。另一方面,一些研究者通过分析光学相关谱、散射光谱估计等理论,并与光学系统、光电探测器等硬件测量技术相结合,完成对动态光散射颗粒分布的测量[12-13]。大多数反演算法都需要大量先验知识来确定相关的参数,因此人工干预较多,存在抗噪能力差,测量精度低等不足。使用硬件设备虽然测量精度高,但仪器价格昂贵。针对已有测量方法的不足,本文将软测量概念引入动态光散射颗粒分布测量中,提出一种基于改进Bagging的人工智能集成方法,从大量颗粒分布与相关函数的数据中获取信息,建立颗粒分布软测量模型,巧妙地回避了求解Fredholm积分方程这一难题,有效地克服了传统方法需要大量先验知识、抗噪能力差的不足,为动态光散射技术测量颗粒分布提供了新的可靠途径。

2 改进Bagging的颗粒分布软测量

2.1 动态光散射颗粒分布软测量模型的建立

对随机的散射光信号进行相关运算并作归一化处理,可以得到归一化的散射光强自相关函数g(2)(τ),它与归一化的电场自相关函数g(1)(τ)的关系为:

(1)

式中:τ是延迟时间,A是实验基线,β是相干因子。

对于多分散颗粒系,归一化的电场自相关函数的分布积分为:

(2)

在求解方程(2)得到G(Γ)后,通过衰减线宽—平移扩散系数—颗粒粒径换算后,可求得颗粒粒径的分布G(d)。式(2)为第一类Fredholm积分方程,而且在g(1)(τ)中不可避免地存在着噪声,在此情况下求解颗粒粒径分布属于病态问题,解通常会发生严重偏离,甚至无法求解[14-16]。而如果已知G(Γ),则可以很容易地求得g(1)(τ),因此可以考虑利用这一特性获得分布函数及自相关函数的大量数据,再使用人工智能方法对这些数据进行学习,并建立颗粒粒径分布函数的软测量模型,从而实现对颗粒分布的测量,如图1所示。

图1 基于Bagging的颗粒分布软测量结构图

Fig.1 Structure diagram of soft measurement of particle distribution based on Bagging

2.2 基于改进Bagging的颗粒分布软测量集成算法

作为一种新的机器学习方式,集成学习的测量精度较传统单一学习算法高。其基本思想是将多个精度较低的弱学习机集成,得到一个较强的学习机[17]。Bagging集成算法首先通过bootstrap,即有放回式的抽样方法,得到相应数量的子训练集,然后使用子训练集对弱学习机进行训练,最后将训练弱学习机得到的结果进行集成得到强学习机,并输出最终结果。在训练过程中,各子数据集相互独立,测量子函数并行生成,因此,集成后的最终模型精度以及泛化性能均得到了很大的提高[18]。

改进后用于颗粒分布软测量的Bagging集成方法结构图如图2所示。

图2 基于Bagging的集成软测量模型结构图

Fig.2 Structure diagram of integrated soft measurement model based on Bagging

输入:

(1)数据集Data样本数量为m:

其中y=y1,y2,…,yR。

(2)确定子学习机算法。

(3)确定子学习机个数T以及子训练集的大小L。

(4)设定阈值参数φ=(φ1,φ2,…,φR)(φ>0)。

循环:t=1,2,3,…,T

(1)采用bootstrap抽样方法抽取L个数据组成的训练子集St。

(3)

(4)

(5)计算权重因子:

(5)

输出:

(6)

较传统的反演推导算法而言,使用软测量方法获取动态光散射颗粒分布的精度较高,操作简单,只需在实验训练过程中调整阈值参数以获取准确的模型,无需繁复的先验背景知识以及复杂的数学推导过程,为研究动态光散射颗粒分布提供了另一种可能。

3 实 验

3.1 测试数据测量实验

在用已知G(Γ)反推求解g(1)(τ)的过程中,通过改变100~800 nm单峰颗粒Johnson’sSB参数u与σ,获取实验所需175种颗粒粒度分布数据用于训练模型,其中u∈(0.8,3),σ∈(1.8,6.8),数据噪声水平为105。训练数据的输入为200维,输出为70维。测试数据分为5组,其参数如表1所示。

表1 测试数据对应参数表

均方根误差RMSE的计算公式如式(7)所示:

(7)

实验采用三层的BP(Back Propagation)神经网络作为子学习机,子学习机个数为40,子训练集大小为100。建立好软测量模型后,使用5组测试数据进行实验仿真。1、2、3组数据加入的噪声水平相同,峰值不同;3、4、5组数据峰值相同加入的噪声水平不同。噪声水平的值越大说明该数据噪声越小。5组数据的峰值、宽度分布及均方根误差如表2所示,测量分布图如图3、图4所示。

(a)第1组参数测量结果(u=1.5,σ=6.8)

(b)第2组参数测量结果(u=3,σ=2.6)

(c)第3组参数测量结果(u=1.5,σ=2.6)

(a)第3组参数测量结果(noise factor=1×105)

(b)第4组参数测量结果(noise factor=1×1010)

(c)第5组参数测量结果(noise factor=1×1015)

模拟测试预测分布宽度/nm真实分布宽度/nm预测峰值/nm真实峰值/nm均方根误差/nm数据1415~695405~6755395320.0061数据2105~595105~5752772710.0030数据3195~675195~7354304220.0018数据4215~715195~7354264220.0013数据5215~715195~7354234220.0008

实验结果表明,软测量方法获得的颗粒分布精度较高且抗噪性能良好。针对不同的动态光散射颗粒分布,测量总体效果较好,分布宽度的预测值与真实值大致相同,峰值误差较小,精度可达到8 nm。在加入噪声后,软测量建模算法的误差增大,但随着噪声的增加,误差增长幅度较小,有一定的抗噪性能。

3.2 真实数据测量实验

300 nm与503 nm标准颗粒采用MilliPore Milli-Q/ Milli-Rho系统去离子蒸馏水稀释,稀释后的300 nm(3 300 A)颗粒浓度为3.0×10-4wt%,503 nm(3 500 A)颗粒浓度为2.0×10-4wt%。样品池温度控制在25 ℃,Ar+激光器的激光功率为50 mW,将通道BI-2030AT 72相关器测量的粒径作为标准粒径用于数据的对比。对于300 nm标准粒径,相关器测量值为324 nm±2 nm,对于503 nm标准粒径,相关器测量值520 nm±4 nm。

实验分别使用改进Bagging的软测量方法与基于二阶光强相关函数的改进反演算法[2]对300 nm 与503 nm标准颗粒数据进行分布测量,其中反演算法采用约束Tikhonov正则化,参数选取为固定值0.005。图5为两种算法得到的300 nm颗粒与503 nm颗粒分布图。

(a) 300 nm颗粒反演结果与软测量结果对比图

(b) 503 nm颗粒反演结果与软测量结果对比图

图5表明,软测量方法得到的300 nm标准颗粒峰值为303 nm,精度为3 nm;503 nm标准颗粒峰值为507 nm,精度为4 nm。而反演算法得到的300 nm标准颗粒峰值为295 nm,精度为5 nm;503 nm标准颗粒峰值为513 nm,精度为10 nm。较真实的标准颗粒而言,软测量方法精度较高,而且软测量得到的分布宽度比反演算法得到的分布宽度窄,较为稳定。

4 结 论

本文根据动态散射光颗粒的特点,与软测量技术相结合,提出了改进Bagging的高维度软测量方法。首先通过反求解的方法求解第一类Fredholm积分方程获得大量不同的动态光散射颗粒分布数据。然后用所获取的数据训练子学习机。最后将子学习机集成为最终的软测量模型并使用测试数据进行检验。实验结果表明,对于模拟数据,该软测量方法的峰值精度最高可达1 nm,对于真实数据精度最高可达3 nm,精度优于反演算法。本文所研究的软测量技术为动态光散射颗粒分布的测量提供了新的可靠途径。

[1] 王雅静,郑刚,申晋,等. 用于动态光散射颗粒测量的改进双指数算法[J].中国激光,2009,36(s2):173-177. WANG Y J, ZHENG G, SHEN J,etal.. Improving double exponential algorithm for particle sizing in dynamic light scattering [J].ChineseJournalofLasers, 2009,36(s2):173-177.(in Chinese)

[2] ZHU X, SHEN J, WANG Y,etal.. The reconstruction of particle size distributions from dynamic light scattering data using particle swarm optimization techniques with different objective functions [J].Optics&LaserTechnology, 2011, 43(43):1128-1137.

[3]SCHURTENBERGER P, SCHEFFOLD F, SHALKEVICH A,etal.. PCS particle sizing in turbid suspensions: scope and Limitations [J].ModelingAnalysis&SimulationofComputers&TelecommunicationSystems,mascots.ie, 2004, 21(1):28-46.

[4] SHI W, SONG J, ZHU X,etal.. Design of weighing transmitter in corn yield measurement system [C]ProceedingsoftheFirstElectricInformationandControlEngineering,Wuhan,P.R.China:ICEICE, 2011:324-327.

[5] MORRISON I D, GRABOWSKI E F, HERB C A. Improved techniques for particle size determination by quasi-elastic light scattering [J].Langmuir, 2002, 1(4):496-501.

[6] PROVENCHER S W. A constrained regularization method for inverting data represented by linear algebraic or integral equations [J].ComputerPhysicsCommunications, 1982, 27(3):213-227.

[7] CLEMENTI L A, VEGA J R, GUGLIOTTA L M,etal.. A Bayesian inversion method for estimating the particle size distribution of latexes from multiangle dynamic light scattering measurements [J].Chemometrics&IntelligentLaboratorySystems, 2011, 107(1):165-173.

[8] ZHU X, SHEN J, THOMAS J C. Analysis of noisy dynamic light scattering data using constrained regularization techniques [J].AppliedOptics, 2012, 51(31):7537-7548.

[9] LIU X Y, SHEN J, THOMAS J C,etal.. Multiangle dynamic light scattering analysis using angular intensity weighting determined by iterative recursion [J].AppliedOptics, 2012, 51(7):846-854.

[10] 王雅静,申晋,郑刚,等.Tikhonov正则化与多重网格技术相结合的动态光散射反演[J].光学 精密工程,2012,22(5):963-971. WANG Y J, SHENG G, ZHEN G,etal.. Invertion of dynamic light scattering combining Tikhonov regularization with multi-grid technique [J].Opt.PrecisionEng.,2012,22(5):963-971.(in Chinese)

[11] 曹丽霞,赵军,孔明,等 基于改进的Chahine迭代算法的粒径分布反演[J]. 红外与激光工程,2015,44(9):2837-2843. CAO L X, ZHAO J, KONG M,etal.. Inversion of particle size distribution based on improved Chahine algorithm [J].InfraredandLaserEngineering, 2015,44(9):2837-2843.(in Chinese)

[12] 杨晖,郑刚,张仁杰. 用动态光散射时间相干度法测量纳米颗粒粒径[J]. 光学 精密工程,2011,19(7):1546-1551. YANG H, ZHENG G, ZHANG R J. Measurement of nanoparticle sizes by variance of temporal coherence of dynamic light scattering [J].Opt.PrecisionEng., 2011,19(7):1546-1551.(in Chinese)

[13] 杨晖,郑刚,王雅静. 用动态光散射现代谱估计法测量纳米颗粒[J]. 光学 精密工程,2010,18(9):1996-2001. YANG H, ZHENG G, WANG Y J. Measurement of nano-particles by dynamic light scattering based on spectral estimation [J].Opt.PrecisionEng., 2010,18(9):1996-2001.(in Chinese)

[14] GAO S, SHEN J, THOMAS J C,etal.. Effect of scattering angle error on particle size determination by multiangle dynamic light scattering [J].AppliedOptics, 2015, 54(10):2824-2831.

[15] KIM J, AHN S, LEE H,etal.. Estimation of particle size distribution using photon autocorrelation function from dynamic light scattering considering unknown baseline[J].OpticsLetters, 2013, 38(11):1757-1759.

[16] ClEMENTI L A, VEGA J R, GUGLIOTTA L M. Particle size distribution of multimodal polymer dispersions by multiangle dynamic light scattering. solution of the inverse problem on the basis of a genetic algorithm [J].Particle&ParticleSystemsCharacterization, 2012, 27(5-6):146-157.

[17] TIAN H X, MAO Z Z, WANG A. A new incremental learning modeling method based on multiple models for temperature prediction of molten steel in LF[J].IsijInternational, 2009, 49(1):58-63.

[18] TIAN H X, MAO Z Z, WANG Y. Hybrid modeling of molten steel temperature prediction in LF[J].IsijInternational, 2008, 48(1):58-62.

田慧欣(1978-),女,辽宁抚顺人,副教授,2005年、2009年于东北大学分别获得硕士、博士学位,主要从事人工智能软测量及应用研究。E-mail: tianhuixin@tjpu.edu.cn

彭 晓(1992-),女,湖北孝感人,硕士研究生,主要研究方向为人工智能软测量方法及光干涉测量的研究。E-mail: 853050658@qq.com

(版权所有 未经许可 不得转载)

Soft sensing of particle size distribution in dynamic light scattering measurement

TIAN Hui-xin*, PENG Xiao, ZHU Xin-jun, MENG Bo

(1. School of Electrical Engineering & Automatic,TianjinPolytechnicUniversity,Tianjin300387,China;2.KeyLaboratoryofAdvancedElectricalEngineeringandEnergyTechnologyinTianjin,TianjinPolytechnicUniversity,Tianjin300387,China)

As the traditional inversion algorithms for particle size distribution measurement by dynamic light scattering show complex computation, lower accuracy and poorer anti-noise capacity, this paper proposes a soft sensing method for particle size distribution based on improved Bagging algorithm by using idea big data. The data of autocorrelation function and particle sizing distribution were obtained by changing the parameters of particle distribution shape. Then the learning machines were trained by the data. Finally, the traditional Bagging algorithm was improved on the basis of the character of high dimensional data. The improved Bagging strategy was used to aggregate the machines for bettering the model accuracy and its generalization performance. A validation experiment was performed by simulating the single peak data and soft sensing for the standard particles with a diameter of 300 nm. Experiment results demonstrate that the proposed method predicts the peak position and the width of particle sizing distribution accurately, and the best accuracy of peak position measurement is 1 nm. Meanwhile, the accuracies for standard particles with diameters of 300 nm and 503 nm are 3 nm and 4 nm, respectively. The proposed method provides a new way for the particle size distribution measurement in dynamic light scattering.

dynamic light scattering; particle size distribution measurement; soft sensing; Bagging algorithm

2016-07-02;

2016-09-01.

国家自然科学基金资助项目(No.61403277;No.71602143)

1004-924X(2016)11-2814-07

TP301;TB92

A

10.3788/OPE.20162411.2814

*Correspondingauthor,E-mail:tianhuixin@tjpu.edu.cn

猜你喜欢

演算法学习机峰值
“四单”联动打造适龄儿童队前教育峰值体验
《四庫全書總目》子部天文演算法、術數類提要獻疑
单多普勒天气雷达非对称VAP风场反演算法
基于极限学习机参数迁移的域适应算法
基于改进极限学习机的光谱定量建模方法
分层极限学习机在滚动轴承故障诊断中的应用
运动平台下X波段雷达海面风向反演算法
宽占空比峰值电流型准PWM/PFM混合控制
基于峰值反馈的电流型PFM控制方法
一种基于AdaBoost的极限学习机分类方法