APP下载

海温观测资料的三维时空分布和偏度特征研究

2011-09-25王辉赞张韧安玉柱陈奕德

海洋通报 2011年2期
关键词:偏度海温正态分布

王辉赞,张韧,安玉柱,陈奕德

(1.解放军理工大学气象学院 全军海洋水文环境数值模拟中心, 江苏 南京 211101; 2.中国科学院大气物理研究所 大气科学和地球流体力学数值模拟国家重点实验室,北京 100029)

海温观测资料的三维时空分布和偏度特征研究

王辉赞1,2,张韧1,2,安玉柱1,陈奕德1

(1.解放军理工大学气象学院 全军海洋水文环境数值模拟中心, 江苏 南京 211101; 2.中国科学院大气物理研究所 大气科学和地球流体力学数值模拟国家重点实验室,北京 100029)

利用包含Argo和WOD05的历史现场观测数据集,分析研究了全球历史海温观测的三维时空分布特征,并对观测数据的偏度特征进行研究。研究结果表明:1)海温观测数据在全球许多海域(特别是南大洋和北冰洋)较为稀少,大多数观测集中在北欧沿海、北美的东西部沿海和西北太平洋区域以及其他少数区域;北半球观测数据明显多于南半球;2)海温具有明显的非对称性分布特征,其非正态分布和有偏现象是一个全球的普遍现象,且随着海区和深度而变化;非正态分布网格数量在任意给定的深度层次上占总网格数的比率超过80%;3)海温观测在各水平层次总体上具有正偏的特性,但在黑潮、湾流、南极绕极流等区域呈现出负偏的特征;具有正偏分布特征的区域网格数量占全球网格总数的比例随着深度的增加而增加,至600 m时达到75%左右。

历史温度观测;非正态分布;偏度;时空分布;非对称性

Abstract:Based on Argo and WOD05 observations,the spatial-temporal distribution characteristics and the skewness distribution of global temperature observations are studied carefully.The results are shown as follows:1) ocean temperature data in much of the world’s ocean, especially in the Southern Ocean and the Arctic Ocean, are measured sparse and most observations are mainly concentrated in the coast of northern Europe, the west and east coasts of North America, and the Northwestern Pacific Ocean, and a few other areas; the number of observations in the Northern Hemisphere is more than that in the Southern Hemisphere obviously; 2)ocean temperature has obviously asymmetric distribution characteristics, and its nonnormal distribution is a global phenomenon, which varies with region and depth; there are more than 80% of the total 3° squares number with nonnormal distribution at any given depth; 3)the skewness of the ocean temperature observation frequency histogram is positive at different depths in all, but the skewness is negative in some regions such as Kuroshio current, Gulf stream, Antarctic Circumpolar Current and so on; The number proportion of the positive skewness distributions increased with the depth increased,which even reach 75% or so at 600 meter.

Keywords:historical temperature observations; nonnormal distribution; skewness; spatial-temporal distribution; asymmetric distribution

海洋温度是一个描述海洋物理状态的变量,对于研究全球海洋环流和全球气候变化具有十分重要的意义。Argo全球观测网建立以后,海洋温度观测数据逐步增加。将Argo观测资料和历史海温观测资料相结合,研究海温的时空分布特征,具有重要的科学意义。

海洋与大气数据统计分析处理中经常假设观测具有正态分布的概率密度函数[1,2]。然而,地球物理系统并非一定是满足正态分布的。比如:根据线性海浪理论,波面相对静止水面的高度为随机量并遵从正态分布。但理论和观测都表明,由于非线性的影响,海浪波面高度的概率分布不是正态的。越来越多的研究表明,海表温度、海表盐度和海面高度等要素都呈非正态分布特征[3-6]。如,许多学者注意到赤道东西太平洋SST(Sea Surface Temperature)的非对称性特征[3,7-9];也有学者注意到湾流系统的SST距平负偏的变化特征,并认为随机温度平流是造成负偏的主要原因[10]。

因此,非对称特征或非正态特征问题是地球物理系统中存在的一个内在特征。但由于深层海洋观测资料比较少,以往对海洋状态场的非对称性研究工作主要集中在海表温度、海表高度、海面风场等表层特征研究,对于次表层或更深层的非对称性特征研究偏少。同时,前人研究工作主要基于模式资料或再分析资料进行物理变量的非对称性研究,而模式和观测之间在非对称性方面存在较大差异[3]。随着Argo温度的观测前所未有的增多,需要揭示和回答的科学问题是:海温观测数据的三维时空分布特征如何?能否利用观测资料揭示海洋次表层以下温度是否存在非对称性分布特征?偏度在不同深度层和不同地理位置存在什么分布特征呢?

1 数据预处理

本文使用的海温观测数据包含两部分:一部分是来自于全球Argo计划的浮标观测数据[11],其时间范围为1996年1月至2008年11月;另一部分数据来自于世界大洋观测数据(WOD05)[12],其时间范围从1958年到2008年。WOD05数据包含11个数据子集(OSD, CTD, MBT, XBT, SUR, APB, MRB, PFL, DRB, UOR和GLD),每种子集代表不同类型的观测仪器。WOD05数据中的PFL子集包含72%的Argo数据,但数据更新较慢,为避免重复数据,在数据分析中不包含PFL子集数据,而用从中国Argo实时资料中心下载的Argo观测资料替代。

WOD05数据记录的是深度,Argo剖面观测记录的是压强。为统一起见,采用Saunders[13]中的公式将Argo剖面的观测压强转化为相应的深度。将原始观测剖面离散深度数据通过垂直插值到选定的43个标准层:0, 10, 20, 30, 50, 75, 100, 125, 150, 175, 200, 225, 250, 275, 300, 325, 350, 375, 400, 425, 450, 475, 500, 550, 600, 700, 800, 900, 1 000, 1 100, 1 200, 1 300, 1 400, 1 500, 1 750, 2 000, 2 500, 3 000, 2 500, 4 000, 4 500, 5000, 5500 m。由于仅对各个单独剖面进行垂直插值处理,下文将标准层化后的这些非格点数据仍称为观测数据。

为方便起见,将Argo和WOD05结合的标准层剖面数据根据各自观测的空间位置放入 3°×3°的网格区域内并进行如下质量控制:首先,如果存在两个或多个剖面观测数据空间位置在同一个 1°×1°的区域内,时间为同一天且采用同一类型海洋探测仪器,则认为是重复的,保留其中有效观测数较多的一个剖面,剔除其他剖面;其次,对于每一个标准层上3°×3°区域内的数据(观测数超过14),计算其平均值和标准差,并进行三倍标准差检验,如果某一数据值不在“平均值±3×标准差”的区间范围内,则剔除该数据;第三,如果某个剖面通过以上两步质量控制后剔除的数据数多于5个,则剔除该观测剖面。

2 海温观测资料的分布状况

标准层插值处理后的海温样本观测数量在不同标准层深度上随时间变化结果表明(图1a):海温从海表层到2 000 m层的逐年观测样本数量在1958—1970年间逐年上升,在整个70年代和80年代数量保持稳定。从90年代初到2000年观测样本数量减少的原因可能由于相关机构未及时将数据提交至各国海洋数据中心。而从2000年开始,由于Argo计划的实施,从10m至2 000 m左右的观测数据迅速增长。同时,样本观测总数量按月份统计的分布情况表明(图1b):观测样本总数量在冬季月份相比其他季节而言稍微有所减少,但总体上各个月份分布比较均匀。这表明从观测数据揭示的总体特征与季节性变化关系不大。

在世界海洋表面大约有5 400个3°×3°属于海洋的小区域网格(由于地形原因,海洋区域网格数量随着深度变深而减少),所以即使每年能收集5.4万个全球海洋观测数据,平均每个海洋小区域网格也只有10个观测数据。直到大约1960年后,在整个世界大洋每年海表温度测量的数量开始超过5.4万个海洋观测。此外,海温观测数据集中的区域分布不均,主要集中在以下少数几个区域:北欧沿海、北美的东西部沿海和西北太平洋区域以及其他少数区域(如图2)。同时从图中可以看到热带地区的TAO观测阵对于历史温度观测数量的补充较大。在全球范围内存在许多观测数据稀少的地区;在海洋表层占7.2%的3°×3°海洋区域网格缺乏观测数据;16.2%的海洋网格中观测数量不足10个(如表1)。大多数观测稀少地区位于南半球,南大洋和北冰洋海温观测数据稀少。

图1 插值到标准层后的海洋温度样本观测数量在不同层深度上分别按年份(a)和月份(b)统计的分布情况,纵坐标为对数坐标Fig.1 Number distribution statistics of ocean temperature data after interpolating to the selected standard level by year (a) and month (b).Note logarithmic scale of vertical axis.

图2 10 m层3°×3°小区域网格内海温历史观测数量空间分布图。蓝色:观测数>10 个; 绿色:观测数>100 个;黄色:观测数>1000个;红色:>10000个;白色:观测数不足10个Fig.2 Number of historical ocean temperature observations per 3°square at 10 meter.Blue represents observation number,>10 observations; green>100 observations; yellow>1000 observations; red>10000 observations;white color means the number of observations is less than 10

表1 3°×3°网格海温观测数量统计aTab.1 Number of 3°squares with given number of observationsa

图3 Argo温度观测总量与WOD05温度观测总量的百分比Fig.3 Ratio of total Argo observation number to WOD05 number

随着 Argo计划的实施,海温观测资料数量得到改善的效果如何呢?由于 Argo在不同海区的改善效果不同,将全球海洋(此处不考虑北冰洋)分为7个海区:北太平洋、北大西洋、北印度洋、南太平洋、南大西洋、南印度洋和南大洋,检查Argo观测数量在不同海区对WOD05观测数量的改善效果。图3为不同海区Argo温度观测与WOD05温度观测的百分比随深度变化图。图中可以看出,Argo温度的改善数量明显的主要为南半球位置,在海洋中层甚至超过了WOD05数据的历史温度观测数量总和。改善效果呈中间层改善多,浅层和更深层改善少的态势,其中在1 750 m深度附近改进最大。这是由于在表层,WOD05资料数量很多,所以Argo增加改善效果有限;而Argo浮标设计观测深度目标为2000 m,但由于各种原因,部分浮标观测深度不足2000 m,导致该层及其以下的Argo观测数据偏少,从而在该层改善效果不明显。但总而言之,Argo观测对于历史观测剖面资料数量进行了大大地补充,尤其对次表层观测的改善效果十分明显。

3 非对称性特征分析

3.1 正态分布

正态分布检验用于验证随机变量是否服从正态分布,很多理论和方法都是基于正态分布假设提出,因此对样本进行正态分布性质检验非常必要。由于标准正态分布的偏度和峰度值为0,可以用偏度和峰度值对正态分布情况进行描述。对样本进行偏度-峰度检验方法[14]如下:

其中,n代表样本数据点的个数,g1和g2分别表示偏度和峰度(其计算公式见3.2节),1σ和2σ分别表示偏度和峰度的均方差,N(0,1)表示服从均值为0、均方差为1的标准正态分布。

假设要检验的变量是遵从正态分布的,那么对于给定的显著水平系数α,根据公式(1)—(4)计算则认为变量不遵从正态分布。其中,为标准正态分布中的显著性水平为对应的临界值。

3.2 偏度和峰度

偏度和峰度是用来衡量变量的分布密度曲线形状的数字特征参数。偏度可以用来描述变量概率密度分布的非对称性,峰度可以用来描述分布曲线的陡度。特别地,对于遵从正态分布的变量而言,其对应的偏度和峰度值应为0[15]。

偏度是用来衡量数据在采样平均值附近的对称性情况。如果其计算值为正值,表明密度分布曲线的峰点在平均值的左方,反之亦然(详见附录)。正态分布数据的偏度为 0,任何具有对称性特征的数据的偏度也应该接近0。

描述分布偏度特性的一个有用指标是平均值和众数之差[16]。对于一个中等对称分布,有如下关于平均值、中值和众数三者的经验关系:平均值-众数 ≈ 3×(平均值-中值),这也表明中值相比众数更靠近平均值。因此, Karl Pearson提出一个简单的衡量偏斜度的近似计算公式[17]:

式中:xd为中值。一般来说,Karl Pearson近似偏度S与偏度g1值同号,故平均值与中值之差往往与偏度g1同号,这种关系将在下文中被使用。

峰度的公式是:

对于标准正态分布,其峰度值为零。此外,带“尖”分布的函数(即分布曲线就比较陡)其峰度大于零,而“平坦”分布的函数(即分布曲线平缓)其峰度小于零。

4 海温的正态和偏度分布特征

4.1 正态分布特征

为了解海温数据在每个3°×3°网格区域内的观测特征,对每个数据观测量超过300个的3°×3°网格区域内海洋温度观测进行正态分布检验。正态分布检验采用3.1节的判断方法。以50 m和350 m层为例进行正态分布检验结果显示(图4)。图中黑色网格区域代表该网格内的温度观测呈正态分布;灰色则代表非正态分布。由图可看出,观测数据的非正态分布特性在全球海洋中很明显,特别是在北太平洋和北美洲的东西沿岸。

图4 3°×3°网格区域内观测数据在全球的正态和非正态分布特征。上、下图分别代表50 m和350 m层。黑色:正态分布;灰色:非正态分布Fig.4 Normal and nonnormal distribution characteristics of observations per 3°square at 50 meter (a) and 350 meter(b).Black, normal distribution; gray, nonnormal distribution

图5为正态和非正态分布区域网格数量随深度的变化及正态分布数量所占比例的变化图。只考虑区域网格观测数大于 300的网格(为了使得正态分布检验更有效),从图中可以看出,具有非正态分布特征的区域网格数量所占的比例具有随着深度增加而减少的趋势。正态分布网格数量在任何给定的深度层上占总网格数(只考虑区域网格观测数大于300的网格)的比率不超过20%。

图5 正态和非正态分布网格数量随深度的变化图。点划线:非正态分布网格数量;点线:正态分布网格数量;实线;正态分布数占总的 3°×3°网格数量(只考虑区域网格观测数大于300的网格)的百分比随深度的变化(其纵坐标刻度在右侧显示)。横坐标代表深度的对数坐标Fig.5 Normal and non-normal distribution characteristics at different depths of ocean.Dash-dot line: number of non-normal distribution; dotted line: number of normal distribution; solid line: percent of normal distribution accounted for the total number of 3° squares with more than 300 observations at corresponding depth.Note logarithmic scale of horizontal axis

4.2 偏度分布特征

由3.2介绍的理论可知,严格正态分布样本的偏度为0。从4.1也可以看出,温度观测数据在绝大多数区域是非正态分布的。为进一步考察这个现象,通过计算各层上每个3°×3°网格区域内历史温度观测数据的偏度,得到图6所示的观测数据分别50m和500 m偏度的全球分布特征。从图中可以看出,在50 m层观测数据在低纬度地区呈现负偏特征,高纬度地区呈现出正偏特征,而到500 m层负偏特征的网格数量显著减少。值得注意的是,在黑潮、湾流和南极绕极流等区域,观测数据较多地呈现出负偏特征。在三大洋中,偏度总体的分布特征以正偏为主,该特征越深越明显。同时,偏度分布特征还随着纬度而变化。在海洋表层,低纬度地区温度偏度以负偏为主,而南半球中纬度部分地区以正偏特征为主。南北半球的温度偏度特征基本呈对称分布。

图6 3°×3°网格区域内观测数据在全球50m(上)和500m(下)层的偏度分布特征。灰色:正偏;黑色:负偏Fig.6 Skewness distribution per 3°square all over the ocean at 50m (a)and 500m (b).Gray: positive skewness;black: negative skewness

图7 全球50m海洋所有的3°×3°网格区域内观测数据的“平均值与中值之差”的柱状图。为方便比较,将正值一侧的柱状图高曲线对应反射画到负值一侧。纵坐标为对数坐标Fig.7 Histogram of the mean-median ocean temperature difference at 50 meter for all 3° squares over the globe.Note logarithmic scale on the vertical axis.For comparison, bar heights from the positive axis are reflected onto the negative axis by a dashed line

为定量化各层偏度特征,计算柱状图正值部分对应面积与负值部分对应面积之差,这个数值也恰好等于所有3°×3°网格区域内的平均值之和减去中位数之和,并定义该值代表该层海洋温度偏度总体特征。图8为海洋温度各层偏度总体特征随深度变化图。从图中可以看出,该值几乎在所有深度上均为正值,也就是说,海洋温度观测频率直方图总体上是正偏的。值得注意的是,不能用这个表示量进行不同深度层偏度强弱的比较,因为不同标准层对应的偏度值的幅度不同。

图8 所有3°×3°网格区域内的海洋温度偏度总体特征随深度变化图(实线)。虚线代表值为0Fig.8 Mean-median ocean temperature difference for all 3°squares at different standard levels(solid line).The dashed line denotes that the averaged value of mean-median is zero

图9 正偏和负偏分布网格数量随深度的变化图。点划线:负偏网格数量;点线:正偏网格数量;实线:正偏网格数占总的3°×3°网格数量的百分比随深度的变化(其纵坐标刻度在右侧显示)。横坐标代表深度的对数坐标Fig.9 Skewness distribution characteristics at different by depths of ocean.Dash-dot line: number of negative skewness; dotted line: number of positive distribution; solid line: percent of positive distribution accounted for the total number of 3°squares at corresponding depth.Note logarithmic scale of horizontal axis

图9为正偏和负偏区域网格数量随深度的变化及正偏分布数量所占比例的变化图。从图中可以看出,具有正偏分布特征的区域网格数量所占的比例随着深度的增加而增加。在深度达到600 m时,全球海洋温度观测正偏网格数达到全球网格总数的75%左右。

5 小 结

本文利用Argo和WOD05历史现场观测数据研究了全球海温观测数据的时空分布和非对称性分布特征,主要结论如下:

1、海温观测数据在全球许多海域(特别是南大洋和北冰洋)较为稀少;大多数观测主要集中在北欧沿海、北美的东西部沿海和西北太平洋区域以及其他少数区域;北半球观测数据明显多于南半球。

2、温度观测数据的非正态分布和有偏现象是一个全球的普遍现象。最主要的特征包括:

1)非正态分布网格数量在任何给定深度层上占总网格数(只考虑区域网格观测数大于300的网格)的比率超过80%;

2)从偏度水平空间分布来看,温度观测数据在总体上是正偏的。但在黑潮、湾流、南极绕极流等区域温度观测数据呈现出负偏的特征;

3)从偏度垂直层变化来看,从表层至深层,具有正偏分布特征的网格数量所占的比例随着深度的增加逐渐增加,至600 m时达到的75%左右。

附 录

图A1 负偏和正偏示意图Fig.A1 Schematic diagram of negative and positive skew

负偏(negative skew,如图A1左侧图):偏度值< 0,左侧“尾巴”长一些,分布数量集中在图的右侧,称分布是左偏(left-skewed)的。该分布会有一些相对低的值出现。如(观测):1, 1 000, 1 001, 1 002, 1003。

正偏(positive skew,如图A1右侧图):偏度值>0,右侧“尾巴”长一些,分布数量集中在图的左侧,称分布是right-skewed的。该分布会有一些相对高的值出现。如(观测):1, 2, 3, 4, 100。

[1]陈上及, 马继瑞.海洋数据处理分析方法及其应用 [M].北京:海洋出版社,1991:92.

[2] Emery W J, Richard E T.Data Analysis Methods in Physical Oceanography [M].Amsterdam: Elsevier, 2001:196.

[3] An S, Ham Y, Kug J, et al.El Niño–La Niña Asymmetry in the Coupled Model Intercomparison Project Simulations [J].J Clim, 2005,18:2 617–2 627.

[4] Sura P, Sardeshmukh P D.A Global View of Non-Gaussian SST Variability [J].J Phys Oceanogr, 2008, 38: 639–647.

[5] Bingham F M, Howden S D, Koblinsky C J.Sea surface salinity measurements in the historical database [J].J Geophys Res, 2002,107(C12), 8019, doi:10.1029/2000JC000767.

[6] Sura P, Gille S T.Stochastic Dynamics of Sea Surface Height Variability [J].J Phys Oceanogr, 2010, 40: 1 582–1 596.

[7] Burgers G, Stephenson D B.The “normality” of El Niño [J].Geophys Res Lett, 1999, 26(8): 1 027–1 030.

[8] Dong B.Asymmetry between El Niño and La Niña in a Global Coupled GCM with an Eddy-Permitting Ocean Resolution [J].J Clim, 2005,18: 3 373 – 3 387.

[9] Su J, Zhang R, Li T, et al.Skewness of subsurface ocean temperature in the equatorial Pacific based on assimilated data [J].Chin J Oceanol Limnol, 2009 ,27(3):600-606.

[10]Sura P.On non-Gaussian SST variability in the Gulf Stream and other strong currents [J].Ocean Dyn, 2010, 60(1):155-170.

[11]Roemmich D, Owens W B.The Argo Project: Global ocean observations for understanding and prediction of climate variability [J].Oceanogr, 2000, 13: 45-50.

[12]Boyer T P, Antonov J I, Garcia H E, et al.World Ocean Database 2005 [CD].Levitus S, Ed, NOAA Atlas NESDIS 60, U.S.Government Printing Office, Wash D C, 2006, 190.

[13]Saunders P M, Fofonoff N P.Conversion of pressure to depth in the ocean[J].Deep Sea Res, 1976, 23:109-111.

[14]黄嘉佑.气象统计分析与预报方法 [M].北京: 气象出版社,1990.

[15]White G H.Skewness, kurtosis and extreme values of Northern Hemisphere geopotential heights [J].Mon Wea Rev, 1980, 108: 1 446–1 455.

[16]Pearson K.Contributions to the mathematical theory of evolution, II: Skew variation in homogeneous material [J].Philosophical Transactions of the Royal Society of London, 1895, 186: 343-414.

[17]Stuart A, Ord J K.Kendall’s advanced theory of statistics: Distribution Theory [M].London: Oxford Univeristy Press, 1994.

Three-dimensional spatial-temporal distribution and skewness distribution characteristics based on global ocean temperature observations

WANG Hui-zan1,2, ZHANG Ren1,2, AN Yu-zhu1, CHEN Yi-de1

(1.PLA Research Center of Ocean Envrionment and Numerical Modeling, Institute of Meteorology, PLA University of Science and Technology,
Nanjing 211101, China;
2.LASG, Institute of Atmospheric Physics, Chinese Academy of Sciences, Beijing 100029, China)

P731.11

A

1001-6932(2011)02-0127-08

2010-11-05;

2010-11-19

中加国际科技合作项目(2008DFA22230);国家重点基础研究发展计划( 2007CB816005);国家自然科学基金重点项目(40730843)。

王辉赞(1983- ),男,湖南浏阳人,博士研究生,主要从事物理海洋学研究。电子邮箱:wanghuizan@126.com。

张韧(1963- ),男,四川峨眉人,博士,教授(博导),主要从事海气相互作用研究。电子邮箱:zren63@126.com。

猜你喜欢

偏度海温正态分布
基于深度学习的海温观测数据质量控制应用研究
基于Argo、XBT数据的苏拉威西海温盐特征分析
南印度洋偶极型海温与中国西南地区初秋降水的关系
基于对数正态分布的出行时长可靠性计算
基于偏度的滚动轴承声信号故障分析方法
正态分布及其应用
考虑偏度特征的动态多响应稳健参数设计与优化
正态分布题型剖析
基于偏度、峰度特征的BPSK信号盲处理结果可信性评估
χ2分布、t 分布、F 分布与正态分布间的关系