APP下载

基于主成分累计影响系数法的高光谱大气红外探测器的通道选择试验

2011-01-16张建伟王根张华黄静陈靖吴玲玲

大气科学学报 2011年1期
关键词:迭代法湿度反演

张建伟,王根,张华,黄静,陈靖,吴玲玲

(1.南京信息工程大学数理学院,江苏南京210044;2.国家气象中心,北京100081;3.天津市气象科学研究所,天津300074)

0 引言

星载大气垂直探测器遥感资料在数值预报和气候研究中起着重要的作用。以前由于技术的限制,一般的卫星探测仪器只能提供数量有限的通道,在这种情况下通道选择的原则是通过利用通道的光谱响应特性(如通道的中心频率、带宽等),控制通道的权重函数,使得观测结果能最有效地对大气参数进行反演,此时求解的问题是欠定的。

近年来,随着探测技术的发展,越来越多的高光谱探测器被搭载在气象卫星上。此时求解的问题是超定的。例如,地球观测系统(EOS)第二颗卫星Aqua上携带的大气红外探测仪A IRS,采用红外光栅阵分光术按NASA设计要求,2 378个通道(实际在使用2 378个通道的过程中,已经经过了通道选择,选出了324个通道,以下只考虑这324个通道)覆盖650~2 700 cm-1(3.7~15.4μm)红外谱区域,其光谱分辨率v/Δv高于1 200,扫描宽度约1 650km,星下点分辨率约为13km,垂直分辨率为1km,辐射绝对精度优于0.2K,温度垂直探测精度在l km垂直分辨率下可达1K,而湿度垂直探测精度在2km垂直分辨率下可达10%。真正实现了高精度探测和高光谱分辨率,被用来探测精细的大气温度、湿度廓线等。

与A TOVS仅有20个通道相比,A IRS在实际使用324个通道仍显太多,由此引起新的问题,一个是计算量太大,另一个是通道之间存在相关性。计算量太大不利于业务应用。通道之间的相关性会造成反演或同化的不适定性。如何尽可能多地提取有用信息,去除通道间的相关性,考虑到实际业务中需要从324个通道中选出一些对特定目标(例如,温度和湿度)起主要作用的通道子集。

对高光谱红外探测器的通道选择国内外学者做了大量富有成效的工作。Rodgers(1996)提出用基于信息熵的分步迭代法(以下简记为分步迭代法)进行通道选择。Florence et al.(2002)实现了Rodgers提出的分步迭代法进行通道选择的方法,并且提出了雅可比矩阵法,对比了这两种方法得出雅可比方法比迭代方法省时,但迭代方法的效果较好。最后综合了两者的优点,提出了常量迭代法,常量迭代法的目的是同一通道子集可用于不同的参考廓线,从而其实用性较强。Fourrie et al.(2002)提出手动选取通道的思想,主要采用实时数据评估了Florence et al.(2002)提出的常量迭代法和自己提出的手动选取通道的方法,得出手动选取通道更符合实际情况。Andrew et al.(2003)和Jam es et al.(2005)从同化A IRS观测亮温的角度出发,采用分步迭代法,给出了所选的通道组合,白天48,夜晚62个通道(他们文章中给出的是白天45,夜晚60,后来有所改变,与Jam es Cameron博士私下交流)。

杜华栋等(2008)和张水平(2009)提出的通道选择方法的核心思想是借用Florence et al.(2002)的基于信息熵的分步迭代法,刘辉(2008)采用的是基于权重函数所对应的峰值层进行通道选择。

国内外通行的方法是基于信息熵的分步迭代法,此方法每次都是选信息量较大的通道,且前面选出的通道影响到后面的通道选择,但其存在的主要缺陷是在用迭代法进行通道选择时,依赖于背景误差和观测误差协方差矩阵的给定。然而,背景误差协方差的具体信息缺乏;分步迭代法每次是从未被选中的通道中选出一个,往往比较耗时。Florence et al.(2002)提出的雅可比矩阵法,Filipe et al.(2002)给出了具体的实施过程,首先,用背景误差和观测误差协方差矩阵对其雅可比矩阵进行标准化,然后,类似于权重函数的思想选每层峰值最大时所对应的通道。雅可比方法也依赖于背景误差和观测误差协方差矩阵的给定。在具体选取通道的过程中,只考虑了通道峰值最大贡献层,没有考虑通道之间的相关性。

针对上面方法的缺陷,本文提出基于主成分累计影响系数的通道选择方法。主成分累计影响系数法,既能保住最主要信息,又能得到影响及敏感性较大的通道,且去除了通道之间的相关性;直接对Jacobi矩阵的结构进行分析,不需要过多的先验知识;可以同时考虑多个通道。

1 变分同化的基础

变分同化方法可以有效克服单纯反演计算不适定的困难,实现用正演方法求解反演问题,从方法论上避开了反演问题的复杂性。

变分同化方法的基本思想(张华等,2004)是将资料同化归结为一个表征分析场与观测场、分析场与背景场偏差的二次泛函极小值问题。该泛函(目标函数)一般定义为

其中:xb为背景场或初始猜测值;B是背景误差协方差矩阵;yobs为实际的观测亮温;Robs为观测误差协方差矩阵;H为观测算子及文中下面介绍的辐射传输模式。

变分同化问题可以归结为一个目标函数的极小化问题,根据最优化理论,通过调用某种下降算法来获得最优解xa,即由变分同化后得到的分析场,xa的求解实现了反演和同化的一体化。是Jacobi矩阵,表示各通道观测或模拟亮温相对待反演大气参数温度、湿度等的敏感性。又分别称为温度Jacobi矩阵、湿度Jacobi矩阵等其他。

对于上述所提及的辐射传输模式H,文中采用RTTOV模式(Saunders,2002)进行计算。此模式在垂直方向上,从0.1到1 013.3hPa,共分为43层。RTTOV可考虑大气温度、湿度廓线、云廓线、雨廓线参数的影响。除正模式外,同时还具有切线性模式、伴随模式以及Jacobi矩阵模式。Jacobi矩阵结构如下:

其中:m在文中为通道个数;n为模式层数;T为温度;q为湿度。

2 基于主成分累计影响系数法的通道选择

2.1 主成分分析(PCA)

主成分分析是通过构造原变量的线性组合,产生一系列互不相关的新变量,从中选出少数几个新变量使他们含有尽可能多的原变量信息,从而以较少新变量代替原来较多变量,消除信息冗余,实现模型的简化。也可以利用主成分分析计算原变量的重要性系数进行排序,达到筛选变量降低模型维数的目的。本文用后一种思想,采用累计影响系数法进行通道选择。

PCA数学模型:主成分分析把原始数据(施能,2002)X=Xj=(xij),i=1,2,…,n;j=1,2,…,m映射到新的变量空间Y=Y=(yij),i=1,2,…,n;j=1,2,…,m。其中

U=(ukj),k=1,2,…,m;j=1,2,…,m,U的行向量是原始数据X的协方差矩阵的特征向量。n在文中为模式层数,m为通道个数。

如果系数ukj满足2,…,m;而且系数ukj的确定要使得Yi与Yj(i≠j)相互无关,并使Y1是X1,X2,…,Xm的一切线性组合中方差最大者,Y2是与Y1不相关的X1,X2,…,Xm的所有线性组合中方差次大者,……,Ym是与Y1,Y2,…,Ym-1都不相关的X1,X2,…,Xm的所有线性组合中方差第m大者,则称Y1,Y2,…,Ym为原变量的第1,第2,…,第m主成分。

2.2 影响系数

方差贡献率定义为各主成分相应的特征值占总特征值之和的比例即为该主成分的方差贡献率。

影响系数s定义为主成分的特征向量与各主成分的方差贡献率的乘积,则累计影响系数表示为

sjm为第j个变量对第m个主成分的影响系数。Sj为第j个变量在m个主成分中的影响系数的累计,称为累计影响系数。

2.3 通道预处理和黑名单的建立

剔除噪声较大和衡量气体的强敏感通道,考虑非局部热动平衡(non-L TE)效应的影响,波数在2 220cm-1和2 287cm-1之间的通道全部剔除,考虑到使用模式顶层的不确定性和同化系统的时效性,剔除长波区域CO2和水汽的高层通道,参考ECMW F在使用A IRS时给出的黑名单。其他限制,短波通道(λ≤5μm)由于在白天受到太阳光的影响,所以文中分别考虑白天和夜晚的通道组合。

下面给出在温度、湿度变分同化反演过程中,通道选择的具体实施方案。首先进行通道的预处理,然后采用主成分累计影响系数法选取通道。

2.4 通道选择步骤

首先剔除黑名单中的通道,下面的步骤只针对剩余通道进行操作。

第1步:先考虑白天的通道组合。

第2步:初始只进行温度分析,为了确保温度信息主要来自CO2通道,屏蔽掉受水汽影响和黑名单中的通道。这样确保温度的最小信息都是来自CO2通道,而不是其他通道。受太阳光影响的通道被排除。

第3步:执行第2步,对CO2通道所对应的温度雅可比进行主成分累计影响系数分析。

主成分累计影响系数分析具体操作如下:

1)取(2)式中CO2通道所对应的温度Jacobi矩阵,把H(x)各通道变量按下式

标准化得到标准化矩阵,记为:RPCA=(rji),i=1,2,…,n;j=1,2,…,m。其中:rji为标准化矩阵的元素;n在文中为模式层数;m为通道个数。

2)计算RPCA的协方差矩阵记为Cov(RPCA)。

3)计算Cov(RPCA)的特征值λj和特征矩阵,特征值λj按从大到小排列。

4)对Cov(RPCA)进行主成分分析,取前p个主成分。

挑选前p个主成分的原则:给定一个确定的百分比ε(本文取ε等于90%),选择p使

代表前p个主成分占总方差的百分比,也就是p个主成分的总的贡献率。其中λj表示第j个最大特征值。

5)由(3)式得到新的矢量,根据(6)式,取前面几个影响较大的主要成分,进入累计影响系数的分析。

6)如果有相同的通道在不同的主成分中都被选入,则采用式(4)计算累计影响系数。否则,按照计算影响系数s的定义计算影响系数,最后进行影响系数的排序,选出对温度影响较大的通道,当所选的通道数目达到初始给定的通道数目,或某个通道累计影响系数小于给定的阈值时,则停止此时的通道选择,转到第4步。

第4步:考虑水汽吸收带附近的通道,对H2O通道所对应的湿度雅可比矩阵进行主成分累计影响系数分析,具体过程和第3步温度雅可比矩阵分析类似。由于水汽通道实质对温度的垂直结构也敏感,所以此步骤包括了温度和湿度信息。

第5步:考虑夜晚的通道组合。

第6步:加入受太阳光影响的通道,此时则可以考虑从受到非局部热动平衡(non-L TE)效应影响的通道中选一部分(原始黑名单被放宽)。

第7步:如果要进一步考虑地表信息,则可以加入窗区通道。

第8步:当所选的通道总数达到初始给定的总数或通道的累计影响系数较小时,则停止整个通道选择过程。最终得到白天和夜晚的通道组合。

3 通道选择试验

在进行通道选择试验时,为了说明本文方法可行性,将本文方法和目前公认比较好的基于信息熵分步迭代法的通道选择进行比较。分步迭代法的具体细节,可参阅Florence et al.(2002)所做的工作。

本文和分步迭代法的方法都是采用M et O ffice 1D-V ar(一维变分同化反演)温度反演范围为RTTOV模式分层的整层(43层,从0.1hPa到1 013.3 hPa)。由于在大气层顶部湿度为零,因此本文在进行大气湿度廓线反演时,反演范围为RTTOV模式分层中的第18层到第43层(从122.04hPa到1 013.25hPa),而对于122.04hPa以上的大气湿度不进行反演。对于本文研究的A IRS红外观测,当同一通道从不同观测角度对大气进行探测时,受临边效应的影响,Jacobi矩阵H的值会发生变化。因此,同一仪器针对不同的观测角度进行通道选择时将会产生不同的结果,但本文着重方法的研究,所有的观测选为星下点,方位角为零。对于参考大气廓线,本文采用RTTOV模式自带的中纬度冬季廓线。

3.1 对比分步迭代法和累计影响系数法所选的通道分布

对通道个数的选取,不同文献给的通道数目不同,本文是为后续进行A IRS观测亮温同化做探索试验的,所以参考A ndrew et al.(2003)和Jam es et al.(2005)给的通道数目,白天48,夜晚62。

首先,考虑到地表信息的不确定性,本文先剔除所有峰值在地表的通道(进一步规范黑名单),选出来的通道组合如图1所示,深黄色星号和品红色点号分别表示分步迭代法和累计影响系数法所选出的通道分布。其他不同的颜色代表不同的气体吸收带或窗区通道。

对所选出的通道进行分析,本文的方法和分步迭代法选出的通道不同,在长波CO2区域,两种方法都有通道选入;在窗区,分步迭代法有通道选入,而本文的方法没有通道选入的原因是考虑地表信息的不确定性,文中一开始就剔除了权重峰值在地表的所有通道。本文方法在水汽的强吸收带附近有通道选入,原因相比较于分步迭代法,累计影响系数法更好的得到了通道的信息量(水汽强吸收带附近,湿度Jacobi矩阵的幅度值更大);在短波区域,文中剔除了N2O吸收带处的通道。

图1 分步迭代法和累计影响系数法所选的通道分布(剔除所有峰值在地表的通道)Fig.1 Distribution of the channels selected through the iterative method and cumulativeeffect coefficient method(without channels whose peak values appear on the surface)

其次,考虑到地表信息在后期同化过程中起一定的作用,保留峰值在地表的通道,选出来的通道组合如图2所示。

图2 分步迭代法和累计影响系数法所选的通道分布(保留峰值在地表的通道)Fig.2 Distribution of the channels selected through the iterative method and cumulativeeffect coefficient method(with channels w hose peak values appear on the surface)

从图2可以看出,本文方法和分步迭代法选出的通道大体分布相同,但在CO2和H2O的强吸收带处入选的通道很少或者没有通道入选,原因是在先前的预处理过程中剔除了部分吸收带处的通道(剔除原因是发现有些通道的雅可比敏感线在对流层和平流层都出现了峰值从而导致平流层的信息影响到对流层,造成反演或同化的不适定性),剩余的通道的信息量相对较少,从而未被选入。

3.2 反演结果对比

采用分步迭代法和主成分累计影响系数法,对中纬度冬季廓线进行反演,用分析误差标准差进行比较。

首先考虑剔除所有峰值在地表的通道得到的通道组合,反演温度、湿度的分析误差标准差如图3所示。图3a、c为白天(48个通道),图3b、d为夜晚(62个通道)不同方法下的温度和湿度分析误差标准差对比。

从图3a中可以看出,对于温度的反演,白天通道组合累计影响系数法在700hPa以上的效果胜于分步迭代法。而在700hPa以下效果比分步迭代法差的原因是,先前的预处理过程中,剔除了权重函数峰值在地面的所有通道。图3b夜晚通道组合,效果和图3a白天的相似。图3c对于湿度反演,白天通道组合累计影响系数法在800hPa以上优于分步迭代法。

图3d对于湿度反演,夜晚通道组合累计影响系数法整体优于分步迭代法。

其次,考虑保留峰值在地表的通道得到的通道组合,反演温度、湿度的分析误差标准差。如图4所示。

从图4a可见,对于温度的反演,白天通道组合分步迭代法在200~300hPa的误差小于累计影响系数法,但在600~900hPa累计影响系数法优于分步迭代法。图4b夜晚通道组合,分步迭代法在200~300hPa的误差小于累计影响系数法,但在500~600hPa累计影响系数法优于分步迭代法。从图4c白天通道组合和图4d夜晚通道组合中可以看出,对于湿度反演,累计影响系数法整体优于分步迭代法。

相比较于分步迭代法依赖背景场误差、观测误差协方差和由传输模式得到的雅可比矩阵,累计影响系数法只依赖于雅可比矩阵;分步迭代法每次只考虑一个通道,而累计影响系数法是多通道同时考虑。整体而言累计系数法优于分步迭代法。

4 总结和展望

实际业务中只考虑A IRS的324个通道,但考虑到通道之间的相关性、同化的时效性(通道数目)以及同化或反演效果,必须进行通道选择,选出主要的通道信息,本文提出了主成分累计影响系数法,主成分分析是对雅可比矩阵进行操作的,不依赖于过多的先验知识,对累计影响系数进行排序,可达到通道选择的目的。通道预处理可以首先剔除性能较差的通道,分别考虑白天和夜晚的通道组合,更能较好地利用受太阳光影响的短波通道。从理论分析和试验效果图可以看出此方法用于通道选择是可行的。本文只是着重进行了A IRS通道选择的理论研究,在后期的工作中考虑A IRS实际观测亮温资料同化对模式效果的影响。

图3 白天(a,c)和夜晚(b,d)时温度(a,b;单位:K)及湿度(c,d;单位:g/kg)的分析误差标准差(剔除所有峰值在地表的通道)Fig.3 Analysis of(a,b)the temperature(K)and(c,d)hum idity(g/kg)error standard deviation during the(a,c)daytim e and(b,d)nighttim e(w ithout channels whose peak values appear on the surface)

致谢:Jam es Cam eron博士提供了资料和一些理论解释,谨致谢忱!

图4 白天(a,c)和夜晚(b,d)时温度(a,b;单位:K)及湿度(c,d;单位:g/kg)的分析误差标准差(保留峰值在地表的通道)Fig.4 Analysis of(a,b)the temperature(K)and(c,d)humidity(g/kg)error standard deviation during the(a,c)daytime and(b,d)nighttime(with channels whose peak values appear on the surface)

杜华栋,黄思训,石汉青.2008.高光谱分辨率遥感资料通道最优选择方法及试验[J].物理学报,57(12):7685-7692.

刘辉.2008.A IRS晴空大气温度廓线反演试验[J].气象学报,66(4):513-519.

施能.2002.气象科研与预报中的多元分析方法[M].2版.北京:气象出版社.

张华,薛纪善,庄世宇,等.2004.GRAPeS三维变分同化系统的理想试验[J].气象学报,62(1):31-41.

张水平.2009.A IRS资料反演大气温度廓线的通道选择研究[J].气象科学,29(4):475-481.

Andrew C,Saunders R,Cameron J,et al.2003.Assim ilation of data from A IRS for improved numerical weather prediction[C]∥Thirteenth Interational TOVS Study Conference.Adele,Canada.

Filipe A,Chedin A,Scott N A,et al.2002.A regularized neural net approach for retrieval of atmospheric and surface temperatures with the IASI instrument[J].J Appl Meteor,41(2):144-159.

Florence R,Fourrie N,Ourrie D,et al.2002.Channel selection methods for infrared atmospheric sounding interferometer radiances[J].Quart J Roy Meteor Soc,128(581):1011-1027.

Fourrie N,Jean-Noel thepaut research department.2002.Validation of the NESD IS near real time A IRS channel selection[C]∥ECMW F Tech.M emo.European Center for Medium Range.

James C,Andrew C,English S.2005.Operational use of A IRS observations at the met office[C]∥14th Internat Tovs Study Conference.Beijing,China.

Rodgers C D.1996.Information content and optimisation of high spec-tralresolution measurements[R]∥Paul B H,Wang Jinxue.Optical spectroscopic techniques and Instrumentation for atmospheric and space research II:136-147.

Saunders R.2002.RTTOV-7Users Guide[M].http:∥www.metoffice.com/research/interproj/nwpsaf/rtm.

猜你喜欢

迭代法湿度反演
迭代法求解一类函数方程的再研究
反演对称变换在解决平面几何问题中的应用
路基上CRTSⅡ型板式无砟轨道湿度场分析
H-矩阵线性方程组的一类预条件并行多分裂SOR迭代法
基于湿度控制的室内空气净化器高压电源设计
泰州大桥主缆纵向湿度分布及相关性分析
拉普拉斯变换反演方法探讨
预条件SOR迭代法的收敛性及其应用
跟踪导练(二)(2)
等效源反演成像在激发极化法中的研究及应用