APP下载

基于多种信号分解的台风风速多步预测*

2019-11-06李春祥

振动、测试与诊断 2019年5期
关键词:台风风速模态

李春祥, 李 洲

(上海大学土木工程系 上海,200444)

引 言

我国东南沿海地区城市群密布、经济发达,大跨桥梁和高层建筑众多。同时,该地区也是每年台风登陆目的地之一,占全球台风总数的36%,台风强度也是全球最强(台风中心气压达870 hpa)[1]。据统计,平均每年台风灾害给我国造成约250亿元直接经济损失。随着全球气候变暖,极端气候频现,对台风、雷暴及龙卷风等风灾害的研究正变得越来越迫切。

风速的精确预测研究可以为结构物辅助决策、防灾减灾提供依据,具有重要意义[2]。例如,在台风登陆的过程中,风电场会因为风速的持续波动而难以确定需向配电网注入多少电量,严重时会导致能源运输事故[3]。桥梁和火车也容易受到台风的作用,特别是在强风环境下,较轻的列车材料和较高的运行速度所面临的问题更加严重。建立风力报警系统控制列车在强风下的运行速度是非常必要的[4]。另外,高层建筑和大跨桥梁表面布置的一些传感器会在风灾中失效破坏,导致数据缺失。风速精确预测也可以用于结构健康监测中的传感器数据修复[5]。除此之外,风速多步预测技术可以实现对后续多个时刻的风速值预测。例如,大步长的多步风速预测可以为风电场电网的调整提供更多的时间、为高速铁路风环境做出决策预留更多时间以及增加传感器数据修复长度。同时,多步预测中要用到前几步预测得到的结果,因此多步预测也是检验前几步预测精度的一种方法。

近年来,国内外在风电供能安全、高速铁路风环境及建筑结构防灾减灾等领域开展了一些风速多步预测研究。文献[6-7]引入改进的离散小波变换 (discrete wavelet transform, 简称DWT)和集成经验模态分解(ensemble empirical mode decomposition,简称EEMD)等方法开展基于实时分解技术的风速预测研究,在提高短时风速预测精度和稳定性上表现优异。文献[8]提出一种基于小波分解(wavelet decomposition, 简称WD)和VMD的二次分解风速多步预测模型,该模型综合运用样本熵、误差纠正算法等技术提高模型预测精度,使模型在极强模拟风速大多步预测中具有良好的性能。文献[9]采用奇异值分解(singular value decomposition, 简称SVD)开展了多目标优化组合模型在多步提前风速预报中的研究,该模型能同时具备高精度和强稳定性的优点。从已有的研究来看,短时风速预测主要按照“分解-预测-重构-评价”的过程来开展[10],其中分解是为了将复杂的原始信号变换成几个简单的子信号,然后用人工智能算法对每个子信号进行预测,再将预测结果进行重构和结果评价。针对同一种实测风速信号和预测算法,信号分解方法的效果也会有显著差异,因此有必要对多种信号分解方法的特征进行学习和研究,以提高预测模型在复杂信号预测中的精度和稳定性。

目前,研究仍存在以下问题:a.主要集中于风电场风速预测[11],对于风灾害(如台风)风速数据的预测研究还未见报道;b.大多步预测(一般指5步以上的预测)研究非常少,大多集中在1步预测或3步以内的预测;c.信号分解算法逐渐变得频繁使用,但还没有比较全面的对比研究。基于以上考虑,笔者选取EEMD、完全集成经验模态分解(complete ensemble empirical mode decomposition with adaptive noise,简称CEEMDAN)、局部均值分解(local mean decomposition, 简称LMD)、小波包分解(wavelet packet decomposition,简称WPD)、VMD、经验小波变换(empirical wavelet transform,简称EWT)、鲁棒主成分分析(robust principal component analysis, 简称RPCA)和SVD等8种常用的信号分解方法,并结合经粒子群算法优化的最小二乘支持向量机,建立台风大多步预测模型[8]。大多步预测一般是指预测步数大于5步的情况,具体预测步数由实际问题确定,笔者选择的5步、8步和10步为随机选取,不具有特殊含义。其次,选取位于沿海地区大跨桥梁和高层建筑的两组实测台风风速序列进行预测,分析不同信号分解算法的特点和效果。试验结果表明,基于频域分解的VMD,EWT方法具有较好的效果,适用于台风风速信号多步预测。

1 信号分解算法

将时频分析的信号分解功能用于风速预测,可以把原来复杂的实测信号分解成一系列简单子信号。已有研究表明,信号先分解,再预测,最后集成的预测方法能有效提高风速预测的精度。按分解方式的不同,常见的信号分解方法可分为3类:a.基于信号时域数据特征驱动的分解:经验模态分解(empirical mode decomposition,简称EMD),EEMD,CEEMDAN,多元经验模态分解(multivariate empirical mode decomposition,简称MEMD)及LMD等;b.基于信号频域特性的分解方法:WD, WPD, EWT及VMD等;c.基于矩阵运算的分解方法:主成分分析(principal component analysis,PCA),独立主成分分析(independent princial component analysis,简称ICA),SVD及RPCA等。

EMD是通过信号本身的极值特性分解出具有不同特征尺度的本征模态分量(intrinsic mode function,简称IMF),因其自适应性、无参性和良好的分解效果,应用领域最为广泛,但EMD方法存在模态混叠、端点效应、过包络、欠包络和受噪声影响大等问题。Smith[12]提出LMD,将信号分解为一系列由包络信号和纯调频信号乘积所得的乘积函数(product function,简称PF)分量。与EMD相比,改善了EMD存在的欠包络、过包络和模态混叠现象,能够很好地抑制端点效应[13-14]。LMD作为一种自适应时频分析方法,其本质上是凸显信号的局部特征,保留原信号幅频各自的特性,适合于机械故障诊断、医学信号识别等领域。Wu等[15]提出集成经验模态分解,通过循环添加辅助噪声来消除EMD出现的模态混叠现象,抵消和抑制分解结果中噪声所产生的影响;但在有限次的集成平均后,其重构分量中仍然存在残留的白噪声,虽可通过增加集成次数来降低重构误差,但仍存在计算规模大等问题。文献[16]提出一种具有自适应白噪声的完整集成经验模态分解方法,在分解的每一个阶段都添加自适应的白噪声,然后计算唯一的余量信号获取各个模态分量,解决了EEMD重构误差不为零、分解效率低等问题,其分解过程具有很好的完整性。

由傅里叶变换发展而来的小波变换是通过一组小波基函数不断地分解低频组分来获取子信号。其缺点是无法对高频部分进行进一步分解来获取相应信息。根据先验知识可知,小波包分解将小波函数看成尺度函数,通过尺度方程与小波方程得到一组互相正交的基构成整数平移基,达到将高频部分继续分解的目的,在信号分解中被广泛采用。同时,为了解决EEMD缺乏数学理论、模态混叠等问题,经验小波变换假设分解后的组分有各自的紧支撑傅里叶谱,于是在原信号的傅里叶谱上进行模态划分,根据划分位置自适应构造一系列Meyer小波滤波器,原信号通过滤波器后即可得到若干组分。同样,基于EMD受噪声和信号采样频率影响大的问题,VMD也是在信号的频域上控制带宽的的方式来构造滤波器,但VMD方法把问题转化成变分求解,原信号的傅里叶谱分成由几个中心频率组成的频带,保证了每个子序列的中心频率在时域上的稳定,VMD自带降噪的功能,信号分解效果稳定[17]。

目前,主流的稀疏与低秩矩阵分解算法——鲁棒主成分分析主要用于图像处理及特征识别等领域,注重信号局部信息提取。它是通过矩阵运算将信号矩阵表示成一个低秩矩阵(由于内部有一定的结构信息,造成各行或列间是线性相关的)和一个稀疏矩阵(噪声信号)相加,其本质是在低维空间上寻找数据的最佳投影问题。由于PCA假设噪声是高斯的,因此在噪声较大时,低秩矩阵会被破坏而变成满秩矩阵。RPCA只假设噪声是稀疏的,因此分解结果更加稳定,不受非高斯噪声的影响。奇异值分解也是一种基于矩阵运算的信号分解方法,常用于数据压缩、推荐算法和隐性语义索引等领域,是降维算法中特征分解的常用方法。试验中需要将原来的一维信号通过嵌入维度变成信号矩阵,再对信号矩阵进行奇异值分解从而得到具有不同特征值的信号分量。

笔者选取EEMD,CEEMDAN,LMD,WPD,VMD,EWT,RPCA及SVD等8种典型的信号分解方法,综合对比3类信号分解技术在台风风速信号多步预测领域的优缺点。各信号分解方法的对比汇总如表1所示。

表1 各信号分解方法对比

Tab.1 Comparison of signal decomposition methods

信号分解方法主要内容特征参数设置EEMD在EMD基础上,向原信号中加入频率均匀分布的高斯白噪声,基于信号本身尺度特征和循环终止条件进行自适应分解减轻模态混叠现象和端点效应、抑制噪声干扰;重构误差不为零,易分解出虚假分量;无完备数学理论。高斯白噪声标准差为0.2CEEMDAN通过在EMD提取模态的每个阶段附加自适应高斯白噪声来计算唯一的残余信号,主要基于信号本身尺度特征和循环终止条件进行自适应分解。重构误差为零;分解完整、效率高;无完备数学理论。高斯白噪声标准差为0.2噪声添加次数为500循环最大迭代次数为5 000LMD将原信号分解成若干个由纯调频函数和包络函数相乘得到的PF,其瞬时频率有物理意义,基于信号本身尺度特征和循环终止条件进行自适应分解。每一个PF分量的瞬时频率具有物理意义;注重局部信息提取;仍存在模态混叠现象。子序列数为8WPD在WD基础上对高频小波基数进行类似分解,提取信号高频部分信息。将小波包系数乘以相应的小波函数即可得到子信号。能提取信号高频段和低频段的信息;对非平稳性强烈的信号分解效果较差。分解层数为3小波函数类型为db3EWT其主要思想是确定子信号的傅里叶段,基于Littlewood-Paley理论和Meyer小波设计一系列小波滤波器,将原信号分解成若干个子信号。数学理论完备;合理参数设置可避免模态混叠现象;分解模式多样;但涉及参数较多且效果差异大。参数detect为“locmaxmin”参数reg为“upenv”子序列数为10VMD将在原信号傅里叶谱上确定子信号中心频率的问题转化为变分问题,并基于维纳滤波分离出子信号。有坚实的数学理论;子信号频段稳定,不易受噪声干扰;自带去噪功能;涉及参数较多且效果差异大。带宽收缩限制为2 000子序列数为10不更新第1中心频率分配初始频率截止条件为1×10-7RPCA每一次分解可得到一个低秩矩阵和一个稀疏矩阵,是在PCA的基础上引入SVD,解决非高斯噪声干扰问题。分解不易受噪声干扰,适用于运动图像特征提取;注重局部信息提取。子序列数为10SVD基于矩阵的SVD定理,对任意原信号矩阵A都可以用3个矩阵进行表示A=USV',S为对角矩阵,其每项非零元素即为每个子信号的奇异值,进行逆向计算可得到各子信号。计算原理简单,计算量小;作为稳定的矩阵代数参量,兼具良好的鲁棒性和泛化能力[18]。嵌入维度为10子序列数为10

2 风速预测试验

对于不同类型风速信号和不同预测模型,分解方法的效果也会有较大差别,为此选取多种信号分解算法,针对台风风速和PSO-LSSVM预测模型进行研究。

2.1 风速序列

对两组实测台风风速序列进行多步预测试验,试验1风速数据选取香港某大跨度斜拉桥主塔50 m高度处台风登陆时风速,试验2风速数据选取厦门东海海岸附近某高层建筑楼顶处台风登陆前12 h风速,试验1数据非平稳性强于试验2数据。两组数据时长均为10 min,间隔0.5 s采样,共1 200个采样点,风速实测信息可参考文献[19-20]。笔者取前1 000个采样点为训练集,后200个采样点为测试集,两组风速序列如图1所示。表2为两组数据的统计特征,其中数据非平稳性采用单位根检测(augmented dickey-fuller,简称ADF)法,峰度和偏度用于表征时程的非高斯性强弱。

图1 台风风速实测数据Fig.1 The measured data of typhoon wind speed

表2 风速数据统计特征

2.2 风速多步预测原理

如图2所示,风速预测主要包括以下3个步骤:a. 对实测台风风速序列进行信号分解,每一种信号分解方法都可以得到若干子序列;b. 将每一个子序列划分训练集和测试集,放入PSO-LSSVM多步预测模型,得到预测结果;c. 将各子序列的预测结果重构,得到不同模型的总预测结果,计算评价指标。

图2 预测模型流程图Fig.2 The flow chart of prediction model

笔者取最小二乘支持向量机嵌入维度为10维,用于构造训练集(V1~V1000)和测试集(V1001~V1200),如图3所示,训练集用于训练得到预测模型M,测试集则利用得到的训练模型M计算预测值。LSSVM进行多步预测的原理:训练集由实测值V1~V10得到预测值V11,随后时间步骤前进一步,由V2~V11实测值得到预测值V12,以此类推,直到由V990~V999预测得到V1000,这样通过对训练集数据训练,得到预测模型M(PSO优化算法是在训练集训练得到预测模型的过程中对LSSVM的惩罚因子C和RBF核参数σ进行迭代寻优),再把测试集数据放入该预测模型M,即可得到一步预测的结果V1001~V1200。2步预测中,由于在预测Vn时,Vn-1的实测值是未知的,而Vn-2的实测值是已知的,此时Vn-1的一步预测值可以在一步预测中得到,因此需要用一步预测中的Vn-1替换原矩阵中的实测Vn-1,即将一步预测的结果替换数据矩阵中的第10列(图3中粉色框图部分),得到的预测值V1001~V1200就是2步预测结果。同理,3步预测需要将1步预测的结果替换图3中橘色部分数据,将2步预测结果替换图中粉色部分数据,最终得到3步预测结果。以此类推,最终达到10步预测的目的。需要指出的是,预测模型M在1步预测时就确定,后续多步预测不需要重新计算原始预测模型M,否则会增加的误差叠加。

图3 多步预测原理图Fig.3 The schematic diagram of multi-step forecasting

2.3 评价指标

为定量评价不同信号分解方法对PSO-LSSVM模型预测精度的影响,笔者采用3个常用评价指标进行综合比较,即平均绝对误差(mean absolute error,简称MAE)、均方根误差(root mean square error,简称RMSE)和皮尔逊相关系数。其中:MAE和RMSE从误差角度评价预测精度,值越小说明效果越好;R为皮尔逊相关系数,是从相关性角度评价预测效果,值越大说明预测效果越好。3个指标的计算公式为

(1)

(2)

(3)

其中:n为测试集采样点编号;L为测试集采样点总数;f(n)为测试集风速实测值;h(n)为预测值。

在3个指标基础上,笔者以模型1为基础,提出一项综合性提升指标I用来表征模型2~模型9对模型1的指标提升百分比。I值越大,说明提升效果越好,模型预测结果越好。I的计算如式(4)所示。其中:i=2,3,4,5,6,7,8,9,为模型序号;j=5,8,10,为预测步数;MAE1j为模型1的j步预测MAE值;MAEij为模型i的j步预测MAE值;RMSE1j为模型1的j步预测RMSE值;RMSEij为模型i的j步预测RMSE值;R1j为模型1的j步预测R值;Rij为模型i的j步预测R值。

(4)

3 结果与分析

图4和图5为两组试验提前5步、8步、10步预测的预测风速与实测风速对比图。边缘的散点分步图是以实测数据为横轴,各模型预测结果为纵轴得到,散点越集中在中间的绿线,表明预测结果越好。可以看出,在PSO-LSSVM模型基础上,加入合适的分解算法能有效提高风速信号多步预测的精度。其中:SVD的效果随预测步数的增加会变得波动性降低,相反,WPD的波动随预测步数的增大而变得强烈;LMD的效果一直不理想,存在局部效果较好、局部预测结果偏差大的情况;EEMD,CEEMD也出现了类似LMD在局部位置波动变小的情况,但总体趋势变化更加稳定;RPCA的效果在5步、8步、10步预测中都不理想,与其他方法相比精度普遍较差。值得注意的是,VMD和EWT的性能更好,VMD是8种信号分解方法中预测精度最高、随着预测步数增加效果最稳定的。从两组试验预测结果可以看出,类似EWT,VMD这类先用快速傅里叶变换将信号从时域转化到频域,再在频域上进行滤波构造,最后用分解信号的方法对台风风速多步提前预测问题更加有效。需要指出的是,EWT和VMD方法参数设置较多,划分模态的数量需要人为确定,这对于算法的推广应用较为不利。

表3和表4为两组试验中各模型风速预测评价指标汇总。可以看出:在基于PSO-LSSVM预测模型的台风风速大多步预测中,WPD存在随预测步数增加、预测指标变差的情况;RPCA和LMD的表现一直不佳;CEEMDAN和SVD处于中上水平,比较稳定;VMD和EWT的效果一直不错,在稳定性上VMD更胜一筹,尤其在后期预测步数增加。总体来看,基于信号频域信息的VMD和EWT分解方法预测结果较好,随着预测步数的增大,预测精度高、性能稳定。表5为模型2~9对模型1的综合提升指标。在两次试验中,模型7都表现出最佳效果,综合提升指标分别为36.28%和41.72%,模型6排在第2,综合提升指标分别为33.55%和40.65%。

图4 试验1预测结果对比图Fig.4 The comparison diagram of prediction results in experiment 1

图5 试验2预测结果对比图Fig.5 The comparison diagram of prediction results in experiment 2

4 结 论

1) 每一种信号分解方法都能提升预测精度,但LMD和RPCA这类注重局部信息提取的信号分解方法,在台风风速大多步提前预测中效果不理想。

2) 采用基于频域信息进行信号分解的EWT和VMD方法能显著提高预测精度,并随着预测步数的增加保持稳定的效果,但这两种方法涉及参数较多,对不同的信号和预测模型仍需要调整参数。

致谢试验1风速数据来源于香港理工大学徐幼麟教授,试验2风速数据来源于湖南大学李正农教授。作者在此表示衷心感谢!

表3 试验1预测指标

模型1为PSO-LSSVM;模型2为EEMD-PSO-LSSVM;模型3为CEEMDAN-PSO-LSSVM;模型4为LMD-PSO-LSSVM;模型5为WPD-PSO-LSSVM;模型6为EWT-PSO-LSSVM;模型7为VMD-PSO-LSSVM;模型8为RPCA-PSO-LSSVM;模型9为SVD-PSO-LSSVM

表4 试验2预测指标

模型1为PSO-LSSVM;模型2为EEMD-PSO-LSSVM;模型3为CEEMDAN-PSO-LSSVM;模型4为LMD-PSO-LSSVM;模型5为WPD-PSO-LSSVM;模型6为EWT-PSO-LSSVM;模型7为VMD-PSO-LSSVM;模型8为RPCA-PSO-LSSVM;模型9为SVD-PSO-LSSVM

表5 模型2~9综合提升指标Ii

猜你喜欢

台风风速模态
基于BERT-VGG16的多模态情感分析模型
台风过韩
多模态超声监测DBD移植肾的临床应用
邯郸市近46年风向风速特征分析
跨模态通信理论及关键技术初探
基于最优TS评分和频率匹配的江苏近海风速订正
台风来了
基于时间相关性的风速威布尔分布优化方法
快速评估风电场50年一遇最大风速的算法
日版《午夜凶铃》多模态隐喻的认知研究