APP下载

基于太赫兹光谱技术的煤岩识别方法

2018-03-20丁恩杰

采矿与岩层控制工程学报 2018年1期
关键词:煤岩赫兹折射率

王 昕,赵 端,丁恩杰

(1.江苏建筑职业技术学院,江苏 徐州 221008;2.中国矿业大学 物联网(感知矿山)研究中心,江苏 徐州 221008)

无人化/智能化工作面开采技术是一种高效的安全开采方式。煤炭科技“十三五”明确指出要全面实施创新驱动发展战略,攻克智能矿山中的相关关键技术,将智能化控制技术带入到煤炭主要生产环节中。要达到这一目的,首先要解决煤岩智能识别问题,这也是当前制约智能化采煤装备的重大难题。煤岩识别是指采煤机切割煤层时应尽量沿着煤层和岩层的分界面开采,当切割到岩层时要及时调整采煤机滚筒高度避免造成欠/过切割。这一问题一直是国内外的研究热点,诸多学者也提出了许多具有代表性的研究方法,如图像分析法、截割数据法、电磁法等[1-5]。在诸多方法中,基于太赫兹谱的煤岩识别方法是一种较新颖的研究方法,且展现出了巨大的潜力[6-7]。

通常而言,太赫兹 (Terahertz,THz)波是指频率介于微波和红外之间的电磁波(0.10~10.0THz),其波长为0.03~3.00mm,所以又被称为亚毫米波或者远红外波。近20年来,随着太赫兹技术的巨大进展,太赫兹光谱技术渐渐引起了各个领域学者的广泛关注。相对于其他红外光谱而言,太赫兹光谱具有更高的信噪比、穿透性以及对物质成分的辨识度,此外太赫兹光谱可以直接得到电场的相位,而不需要利用Kramers-Kronig方程求解相位角,相对于其他光谱技术极大地减少了计算量和复杂度[8-11]。目前该方法已经被广泛应用到了食品监测、环境监测、物质成分分析等领域中[12-17]

我们期望能够在太赫兹频段内解决煤岩识别问题,因此选取了7种常见的烟煤和3种常见的砂岩作为研究对象,利用SVM(Support Vector Machine)等数学和计算机工具构建了煤岩分类模型并进行分类测试,并分析了不同的系统参数对模型建立以及识别结果的影响,着力于研究基于太赫兹谱数据的SVM参数寻优方法,从而提出一种优化的THz-SVM煤岩识别方法。实验结果表明基于THz -SVM的煤岩识别方法可以快速稳定地区分出煤岩介质,这也意味着可以通过该方法来描述采煤机的截割状态(割煤/割岩)。虽然目前距离太赫兹设备应用到现场还有着一定的距离,但研究成果表明这种方法有着广阔的应用前景,本文的研究成果也为提出自适应煤岩性状差异性规律的采掘装备截割路径控制理论奠定了基础。

1 相关原理

当电磁波频率达到太赫兹频段时,由于太赫兹光子能级和许多电介质以及材料的振动能级相当,因此太赫兹波照射物体后其光子能量会被吸收,其光强将会产生变化从而形成太赫兹光谱,通过研究太赫兹光谱将能获取检测物质的物理信息(如吸收光谱和折射率谱)。太赫兹光谱通常通过太赫兹时域光谱系统获得,典型的光谱系统包括了飞秒激光器、发射天线、样品测试区、接收天线以及延迟线5个部分[18],如图1所示。其中飞秒激光器用于产生光源,发射和接收天线分别用于产生和接收太赫兹脉冲,延迟线用于调整飞秒激光和太赫兹脉冲之间的时间差,从而获取整个时域上的波形。

图1 太赫兹时域光谱系统

在每次实验时,将每种样品放置在样品测试区测量多次取平均值作为样品信号;以未加样品时的太赫兹信号为参考信号,当获得了测试样品和参考样品的太赫兹时域数据后,对时域数据进行FFT变换,然后可以通过Dorney等人提出的模型计算出样品的折射率n(ω)、消光系数k(ω)和吸收系数α(ω),计算公式如下[19]:

(1)

(2)

(3)

式中,φ(ω)项为测试样品信号与参考信号的相位差;ρ(ω)项为测试样品信号与参考信号幅度的比值;d为样品厚度,m;c为光速,m/s;ω为角频率,rad/s。

支持向量机是一种常用的分类算法,其方法可以描述为一个二分类问题,也即寻找出一个超平面实现两类特征数据的分割,其中超平面的表达式如式(4)所示:

f(x)=ωTx+b=0

(4)

根据入库河道沿线的水塘、湿地分布情况,将入库河道分为四种类型:单一河道型、河道—水塘串联型、河道—湿地串联型、混合型。

(5)

2 实验

为了使所选取的实验样本具有一定的代表性,从山东兖矿集团兴隆庄矿、联想集团郭庄煤矿、淮北矿务集团岱河矿、神华集团黑岱沟矿、邢台矿务集团东庞矿等地分别采集了细砂岩、粉砂岩和中砂岩3种岩石顶板样本以及贫煤、焦煤、1/3焦煤、气煤、气肥煤、不粘煤和长焰煤等煤样多份。按照文献[20]的方法,对煤岩样本进行了破碎、研磨、烘干等步骤,并利用压片机制作了煤岩样品压片共100个,利用前文所描述的太赫兹实验系统,获取了100组实验数据,其中煤样数据70组,岩样数据30组,每种煤岩数据如图2所示。

图2 煤样(a)和岩样(b)的太赫兹谱数据

图3 7种煤和3种岩石的吸收谱和折射率谱

利用公式(1)和(3)计算出煤岩的吸收谱和折射率谱共100组,图3展示了10组数据。其中C1~C7分别为贫煤、焦煤、1/3焦煤、气煤、气肥煤、不粘煤和长焰煤的特性曲线;R1~R3分别表示中砂岩、粉砂岩和细砂岩的特性曲线。通过曲线特征可以发现在固定频率下低阶煤(C6和C7)的吸收特性要强于高阶煤(C1和C2);岩石的吸收特性要强于高阶煤以及气煤等。由于碳含量是反映煤阶的主要因素,岩石混入煤中会增加煤的灰分,因此煤中的碳含量降低与灰分的增加会使煤在太赫兹频段的吸收效应增强。

分别将煤岩样本在太赫兹频段(0.2~1.6 THz)的吸收谱和折射率谱随机地分为训练集和测试集。其中训练集包括了42组煤样数据和18组岩样数据,总计60组数据;测试集包括了28组煤样数据和12组岩样数据,总计40组数据,每组数据的维度为179维。直接利用SVM对太赫兹数据进行建模分类,THz-SVM的分类结果与参数如表1所示。在实验中SVM核函数设为线性核,其余参数设置如表1所示,其中分类准确率为50次分类的平均值。从表1中可以看出,利用煤岩吸收谱数据集进行交叉验证建模时,并不能够建立一个准确的分类模型,其模型准确率仅有95%,其预测准确度也有所欠缺,仅为95%;利用煤岩折射率谱数据集进行交叉验证建模时,可以构建一个准确的分类模型,其预测结果虽然略高于前者达到了约98%,但也并不十分理想。其中的错误为将C6和C7误判为岩石,对比图3中的煤岩吸收谱和折射率谱可发现,C6,C7的吸收与折射特性与岩石相近/相似属于“异物同谱”,这也是在分类过程中造成错误的主要原因。

表1 THz-SVM的参数与结果

为了解决异物同谱的问题,引入了主成分分析(Principal components analysis,PCA)线性降维方法,用来提取煤岩太赫兹光谱中的特征值,并研究支持向量机的参数和核函数对模型的建立和分类结果的影响,相关参数和结果如表2所示,在核函数类型一列中“0”代表线性核函数,“1”代表多项式核函数,“2”代表径向积核函数,“3”代表Sigmoid核函数,表中的数据集(包括训练集和测试集)均经过PCA (Principal components analysis)预处理,分类结果为50次分类的平均值。从表2中可以看出,当核函数发生变化时无论是吸收谱数据集还是折射率谱数据集在经过PCA后均可以通过交叉验证训练出一个精确的识别模型。从识别率的角度来看,线性核函数和径向积核函数可以获得最高的识别准确率,均为100%;Sigmoid核函数识别准确率稍低,识别准确率分别为97.5%和100%;而多项式核函数的识别准确率仅为70%和80%,这也说明多项式核函数不适用于该数据集。此外核函数的变化对折射率谱数据集识别率影响较小,对吸收谱数据集识别率影响较大,结合文献[6]的结论可以发现,利用煤岩吸收谱数据集可以较好地区分不同的煤种,利用煤岩折射率谱数据集可以较好地区分煤岩介质。

表2 不同核函数对分类结果的影响

支持向量机中的2个主要参数分别为惩罚参数c和核参数g。最佳的参数往往对应着最高的训练集分类准确率,当有多组参数同时满足训练集最高分类准确率时,往往选取较小的c来避免过学习和欠学习的现象。下面对比几种参数优化选择方法。

这里以经过PCA后的煤岩样本折射率谱为训练集和测试集,结合网格搜索的方法寻找煤岩分类模型的最优参数,为了减少搜索时间,将c的范围设定在(0.1~20)之间,将g的范围设定在(0.01~20)之间,将测试集分为5部分进行交叉验证,准确率等高线的步进大小设为2.5,结果如图4所示。

图4 网格搜索法参数寻优

图4横坐标和纵坐标分别表示以参数c和g取2为底的对数值,等高线表示取相应参数时所对应的煤岩分类模型的准确率。从图中不难看出有多组参数均可以使得测试集达到最高分类准确率,整个建模过程耗时27.8s。上述方法可以找到全局最优解,但是当数据集较为庞大时进行全局网格搜索最优参数会耗费大量时间。

粒子群优化算法(Particle Swarm Optimization,PSO)是一种基于群体智能的优化算法,与GA相比其没有选择、交叉、变异等过程,而是通过当前最优值来寻找全局最优值。将PSO的相关参数进行如下设置:学习因子C1代表局部搜索能力,设为0.7;C2代表全局搜索能力,设为0.9;进化代数设为100;种群数设为100;将c的范围设定在(0.1~20)之间;将g的范围设定在(0.01~20)之间;交叉验证数设为5,其仿真结果如图5(a)所示。从图中可以看出利用粒子群算法寻找出的最优参数(c=2.9,g=0.39)可以使训练集分类准确率达到100%,算法的平均适应度约为80%,整个建模过程耗时31.5s。

遗传算法(Genetic Algorithm,GA)起源于对生物系统的模拟,其通过选择、交叉、变异等方法来寻求最优解。将GA的相关参数进行如下设置:最大进化代数设为100;种群数量设为100;交叉概率设为0.6;变异概率设为0.01;将c的范围设定在(0.1~20)之间;将g的范围设定在(0.01~20)之间;交叉验证数设为5。其仿真结果如图5(b)所示。从图中可以看出利用遗传算法寻找出的最优参数(c=11.4,g=0.15)可以使训练集分类准确率达到100%,算法的平均适应度约为78%,整个建模过程耗时29.3s。

图5 粒子群算法及遗传算法参数寻优

将3种支持向量机参数优化方法进行对比,相关参数见表3,其中分类模型只需要建立1次,分类准确率为50次分类的平均值,预测耗时为50次分类预测的总时间。从表中可以看出3种优化方法均可获取分类器的最优参数,虽然参数并不相同但都可以实现100%的正确分类;从耗时来看,3种方法耗时大致相同,其中网格搜索的方法相对耗时较少,这是由于智能算法受初值影响较大,且网格搜索范围较小。通过上述分析可以发现,通过PCA特征提取结合SVM参数寻优可以构建准确的THz-SVM煤岩分类模型,并达到100%准确的分类结果,解决了煤岩太赫兹光谱中“异物同谱”的识别问题。这也说明该方法可以快速、高效、准确地辨别出煤岩介质,将其应用在无人化/智能化开采领域,可以实现采煤机的截割状态(割煤/割岩)的准确识别,解决采煤机自动调高问题。

表3 三种优化方法对比

3 结 论

(1)选取了7种煤和3种砂岩利用太赫兹谱技术进行了测试,得到了煤岩样本的吸收谱和折射率谱,发现长焰煤和不粘煤的太赫兹光谱特性与岩石相近,在分类过程中由于“异物同谱”而产生错误,因此引入了线性特征提取方法PCA结合SVM技术构建了煤岩分类模型并进行了参数优化和分类测试。

(2)实验结果表明通过合理的寻优方式,并利用煤岩的吸收特性和折射特性等样本的固有属性,可以建立稳定的THz -SVM煤岩识别模型,从而可以快速稳定地区分出煤岩介质,这也意味着可以通过该方法来描述采煤机的截割状态(割煤/割岩)。

(3)目前距离太赫兹设备应用到煤矿开采现场还有着一定的距离,但随着太赫兹波导技术的发展,可以利用光纤波导的传输方式让太赫兹设备远离现场的复杂环境,而将太赫兹发射信号引入到现场,通过对煤/岩块或煤/岩粉尘的检测实现采煤机截割状态的判定。此外,基于电子学的太赫兹设备相对于其他光谱设备有着更大的现场应用潜力。本文的研究成果提出了一种新的煤岩识别方法,也为提出自适应煤岩性状差异性规律的采掘装备截割路径控制理论奠定了基础。

[1]Sun J,Bo S. Coal-rock interface detection on the basis of image texture features[J]. International Journal of Mining Science and Technology,2013,23(5):681-687.

[2]李 亮,王 昕,胡克想,等. 探地雷达探测煤岩界面的方法与试验[J]. 工矿自动化,2015,41(9):8-11.

[3]李一鸣,符世琛,焦亚博,等. 基于分形盒维数和小波包能量矩的垮落煤岩性状识别[J]. 煤炭学报,2017,42(3):803-808.

[4]王 昕,丁恩杰,胡克想,等. 煤岩散射特性对探地雷达探测煤岩界面的影响[J]. 中国矿业大学学报,2016,45(1):34-41.

[5]张 强,张石磊,王海舰,等. 基于声发射信号的煤岩界面识别研究[J]. 电子测量与仪器学报,2017,31(2):230-237.

[6]WANG X,HU K X,ZHANG L,et al. Characterization and Classification of Coals and Rocks Using Terahertz Time-Domain Spectroscopy[J]. Journal of Infrared Millimeter & Terahertz Waves,2016: 1-13.

[7]王 昕,胡克想,俞 啸,等. 基于太赫兹时域光谱技术的煤岩界面识别[J]. 工矿自动化,2017,43(1):29-34.

[8]Haddad J E,Bousquet B,Canioni L,et al. Review in terahertz spectral analysis[J]. Trac Trends in Analytical Chemistry,2013(44):98-105.

[9]JEPSEN P U,COOKE D G,KOCH M. Terahertz spectroscopy and imaging - Modern techniques and applications[J]. Laser & Photonics Review,2011,5(1): 124-166.

[10]Liu J,Fan L. A novel ADPSO-SVM combined with terahertz spectroscopy for recognition of transgenic organisms[J]. Optik-International Journal for Light and Electron Optics,2016,127(4): 1957-1961.

[11]Liu J,Li Z,Hu F,et al. Identification of GMOs by terahertz spectroscopy and ALAP-SVM[J]. Optical & Quantum Electronics,2014,47(3): 1-11.

[12]Zhan H,Xi J,Zhao K,et al. A spectral-mathematical strategy for the identification of edible and swill-cooked dirty oils using terahertz spectroscopy[J]. Food Control,2016(67): 114-118.

[13]Pohl A,Deβmann N,Dutzi K,et al. Identification of Unknown Substances by Terahertz Spectroscopy and Multivariate Data Analysis[J]. Journal of Infrared Millimeter & Terahertz Waves,2016,37(2): 175-188.

[14]Adbul-Munaim A M,Reuter M,Koch M,et al. Distinguishing Gasoline Engine Oils of Different Viscosities Using Terahertz Time-Domain Spectroscopy[J]. Journal of Infrared Millimeter & Terahertz Waves,2015,36(7): 687-696.

[15]Fan W,Jia C,Hu W,et al. Dielectric properties of coals in the low-terahertz frequency region[J]. Fuel,2015(162): 294-304.

[16]Leng W,Zhan H,Ge L,et al. Rapidly determinating the principal components of natural gas distilled from shale with terahertz spectroscopy[J]. Fuel,2015(159): 84-88.

[17]刘陵玉,杨传法,张献生,等. 太赫兹波段煤的湿度与介电特性关系[J]. 煤炭学报,2016,41(2): 497-501.

[18]LI Q,TIAN Z,ZHANG X,et al. Dual control of active graphene-silicon hybrid metamaterial devices[J]. Carbon,2015(90): 146-153.

[19]DORNEY T D,BARANIUK R G,MITTLEMAN D M. Material parameter estimation with terahertz time-domain spectroscopy[J]. Journal of the Optical Society of America A Optics Image Science & Vision,2001,18(7): 1562-1571.

[20]王 昕,苗曙光,丁恩杰. 煤岩介质在太赫兹频段的介电特性研究[J]. 中国矿业大学学报,2016,45(4): 739-746.

猜你喜欢

煤岩赫兹折射率
玉华矿4-2煤裂隙煤岩三轴压缩破坏机理研究
基于CT扫描的不同围压下煤岩裂隙损伤特性研究
基于双频联合处理的太赫兹InISAR成像方法
太赫兹低频段随机粗糙金属板散射特性研究
太赫兹信息超材料与超表面
基于测井响应评价煤岩结构特征
用Z-扫描技术研究量子点的非线性折射率
如何选择镜片折射率
基于煤岩结构的煤层含气量测井评价方法
读数显微镜测量毛细管管壁折射率