APP下载

EAR70、CLDAS和ERA-Interim表层土壤温度在中国地区的评估

2022-01-04单帅师春香沈润平白磊

气象科技 2021年6期
关键词:土壤温度表层偏差

单帅 师春香 沈润平 白磊

(1 南京信息工程大学地理科学学院,南京 210044; 2 国家气象信息中心,北京 100081;3 海南大学生态与环境学院,海口 570228)

引言

地表温度是地气相互作用研究中的重要变量,是衡量陆面和大气之间能量交换的重要表征[1]。中国地面气象观测网所包含的地面观测站点已超过6万个,但在空间上呈现“东多西少”分布不均匀的格局。除国家级站点外,气象站的观测在时间上存在不连续的现象(如大部分自动站冬季停止观测降水和土壤湿度),土壤温度观测的有无和深度也因地区存在较大差异。这就造成中国气象观测网中土壤温度数据在时间和空间上的局限性。数值模式可以连续模拟出土壤的温湿状态,借助于同化技术可以加入精度高的观测信息,大气再分析和陆面数据同化技术成为获取时空连续的地表温度数据的重要渠道[2-8]。

目前已经有不少较为成熟的大气再分析产品数据集,如ERA-Interim[9]、NCEP/NCAR[10]、NCEP/DOE[11]、MERRA1/2[12-13]、JRA55[14]等,成熟的陆面数据同化系统有:NLDAS[15]、GLDAS[16]、CLDAS(CMA Land Data Assimilation System V2.0)[17-18]等。在东亚地区,CLDAS相比GLDAS使用了更多的地面观测资料,其土壤温度和湿度的精度更高[19-24]。针对大气再分析数据中的土壤温度,在中国地区已经有很多的评估工作,均认为大气再分析土壤温度具有明显的地域特征[25-31]。然而大气再分析侧重于同化大气中参数,用以提高大气参数模拟质量。而陆面数据同化则侧重于同化观测的地面要素,获得较为精确的陆面过程相关变量。结合两种技术的优势,在精细化地面初始状态下进行区域尺度的再分析动力降尺度模拟,有利于获得高质量、高分辨率的陆面过程数据。

基于以上假说,本文针对一套基于精细化地面初始场的区域动力降尺度数据集在时间和空间上进行评估,探讨大气再分析、陆面数据同化以及将两者结合进行动力降尺度所得到的土壤温度数据的精度变化特点,为再分析表层土壤温度产品的改进和用户使用提供建议。

1 研究资料与处理方法

1.1 站点观测资料

土壤表层温度观测数据来源于中国气象数据网(http://data.cma.cn),时间范围为2010—2015年。在研究中,假定所有站点上0~10 cm土壤为均质土壤,故可将0 cm和10 cm土壤温度计算算数平均值代表0~10 cm表层土壤平均温度),使之能够与再分析数据集中土壤表层数据对应,便于后续比较。站点观测和再分析数据均为世界时(UTC),故本文的对比评估结果以世界时为参考。图1为土壤温度数据站点空间分布(中国地图矢量边界审图号为GS(2017)3320号)。

图1 中国地区表层土壤温度观测站点空间分布

1.2 大气再分析和陆面数据同化系统资料

ERA-Interim为欧洲中期预报中心(European Centre for Medium-Range Weather Forecasts,ECMWF)研制的第4代全球大气再分析产品。时间覆盖为1979—2019年,空间分辨率大约为0.75°。其中,分析场时间分别为世界时间的00:00、06:00、12:00和18:00。在本研究中,选取第一层(0~7 cm)土壤温度用于与其他数据进行对比。

CLDAS(CMA Land Data Assimilation System)是国家气象信息中心开发的陆面数据同化系统(可由中国气象数据网http://data.cma.cn/ 获取)。该数据时间分辨率1 h,时间覆盖为2008年至今,空间分辨率为0.0625°,空间覆盖为中国。该数据利用地面、卫星、模式等资料在中国范围使用多种陆面模式进行同化。本研究选取其第1层(0~5 cm)和第2层(5~10 cm)土壤温度数据计算算术平均数代表表层0~10 cm土壤温度。

EAR70是覆盖东亚地区1948—2018年长序列高分辨率地表变量再分析产品。该数据使用WRF模式作为同化平台,分别同化了多套大气再分析数据、地面观测和陆面再分析数据。EAR70运行中在18:00时输入精细化的初始场,Spin-up 6 h达到平衡后进下一天的模拟,来获取大气和土壤的多种参数。在2008—2018年间,EAR70使用CLDAS的土壤状态制作陆面初始场。EAR70空间分辨率5 km,时间分辨率1 h。同化平台为WRF与NOAH陆面模式耦合。本研究使用该数据的第1层(0~10 cm)土壤温度作为表层土壤温度进行分析研究。

空间上,本文使用最近邻插值方法将格网数据转化为站点位置的表层土壤温度。时间上,EAR70和CLDAS计算的指标基于逐小时数据,ERA-Interim则是每日4次的分析时刻与观测土壤温度进行比较。评估再分析表层土壤温度所用到的指标为平均误差(Mean Error, ME)、均方根误差(Root Mean Square Error,RMSE)和Pearson相关系数R。3套数据的评估时间为2010—2015年,共计6年52584个小时数据样本。

ERA-Interim是完整的大气再分析系统,耦合大气和陆面的数值模式。CLDAS在大气再分析产生的大气驱动数据中融合和同化了地面观测,逐时驱动上一时刻平衡态的陆面模式获得土壤信息。EAR70是在ERA-Interim的大气数据和CLDAS土壤温湿状态作为初始场下进行模拟。相比逐时同化数据的CLDAS,EAR70时提前6 h将观测信息放入模式同化(通过使用CLDAS的土壤数据制作初始场),随后模式不受观测数据约束。对于地面气象数据,CLDAS是在ERA-Interim基础上采用不同技术方法融合地面站点。对于土壤状态初始场,CLDAS为上一时刻数据,EAR70为前6 h数据,两者同化土壤状态数据的差别是进入模式的时间。对于模式,CLDAS为NOAH等陆面模式离线运行,EAR70为NOAH模式与WRF模式耦合方式运行,这使得EAR70在一定程度上受到ERA-Interim影响。3套数据均能覆盖中国。这样通过对比不同时间同化土壤状态数据的EAR70和CLDAS,可以明确陆面同化过程中土壤状态信息进入模式的时间和观测数据对于模式的记忆时间能力。

2 结果与分析

2.1 统计指标的空间特征

图2为3种表层土壤温度统计指标空间分布。再分析表层土壤温度在东北地区、新疆地区、青藏高原和四川盆地周围地区ME小于-2 ℃,表现为明显的低估;黄土高原及其东边的地区ME在-1~1 ℃之间。整体上,EAR70、CLDAS和ERA-Interim的ME分别为-1.21 ℃、-0.50 ℃和-1.81 ℃;再分析表层土壤温度在东北、新疆、内蒙和青藏高原地区RMSE大,在其他地区相对较小。EAR70和ERA-Interim在东北、内蒙、新疆、西藏和云南几个地区组成的大区域内RMSE大于5 ℃。整体上EAR70、CLDAS和ERA-Interim的RMSE分别为4.72 ℃、3.0 ℃和4.72 ℃;再分析表层土壤温度相关系数R整体都高,在青藏高原、云贵高原和四川盆地西部以外的地区R都能保持在0.9以上(p<0.05,站点样本量>8000)。在图2中EAR70在东南沿海有一些站点没有通过显著性检验。整体上3套数据的R分别为0.92、0.96、0.93。综合以上3个统计指标,空间上表层土壤温度精度排序依次是CLDAS、EAR70和ERA-Interim。对于 CLDAS和ERA-Interim,精度差别较大的站点主要分布在青藏高原上。

再分析表层土壤温度在东北、内蒙和新疆地区R较高,但是ME小于2 ℃,说明再分析表层土壤温度存在一定的系统性冷偏差,这种系统性的偏差可能和东北、内蒙、新疆地区冬季积雪有关,因此陆面过程同化中同化积雪变量有利于改善这些地区表层土壤温度的模拟精度,减小系统性的冷偏差。在青藏高原地区, EAR70和ERA-Interim 的R降低到0.7~0.8,且ME小于-2 ℃说明再分析表层土壤温度不仅表现出了明显的低估,同时也没有很好地反映出真实表层土壤温度的变化。

ERA-Interim和CLDAS表现都好的地区如黄土高原地区,EAR70表层土壤温度的精度也高。但是在ERA-Interim精度降低的青藏高原地区,EAR70相对于ERA-Interim冷偏差变小了,这受益于CLDAS土壤温度较小的冷偏差,约束EAR70表层土壤温度数值提高。

2.2 统计指标的时间特征

图3为3种表层土壤温度统计指标的时间分布。EAR70、CLDAS、ERA-Interim表层土壤温度平均误差ME有明显的随时刻和季节的变化特征。在时刻上,再分析表层土壤温度ME在03:00—05:00明显减小。EAR70和CLDAS每日在00:00—08:00表层土壤湿度基本表现为低估,在04:00低估达最大(EAR70的ME小于-2.5 ℃,CLDAS的ME小于-1.5 ℃)。ERA-Interim在分析时刻06:00时ME达到-3.5 ℃。在季节上,再分表层土壤温度在夏秋两季表现为低估。在时刻和季节上,再分析表层土壤温度都在温度高的时间(04:00世界时间对应于我国北京时间12:00,正是一天中辐射最强地表温度最高的时刻,夏秋两季是一年中温度最高的两个季节)出现冷偏差。RMSE也有类似的随时刻和季节的变化特征,时刻上,RMSE在每日的06:00附近最大。 EAR70和CLDAS的RMSE在00:00—10:00有一个明显的峰生和峰消的过程,峰值(EAR70大于6 ℃,CLDAS大于4 ℃)出现在05:00,11:00后RMSE基本保持不变(EAR70为4~5 ℃,CLDAS为2~4 ℃)。在季节上,夏秋两季RMSE变大。表层土壤温度相关系数R在时刻上,每日06:00时R最小,EAR70在00:00—12:00相关系数低于0.7,CLDAS在02:00—10:00相关系数为0.7~0.9,12:00以后EAR70和CLDAS相关系数基本保持不变。在季节上夏秋两季相关系数变低。

图3 再分析表层土壤温度统计指标的时间分布

再分析表层土壤温度误差指标的时间变化比较统一。每日06:00前后,每年的夏秋两季出现精度降低。世界时04:00—06:00对应于北京时12:00—14:00,中国大部分地区的地表温度都在这个时段升到每日的最高,这时再分析表层土壤温度ME为较大的负值,这说明再分析模拟的表层土壤温度上升速度比真实情况慢。在季节上,夏秋两季是表层土壤温度一年中数值高的时段,再分析表层土壤温度在这两个季节表现为明显的低估,这说明在长时间尺度上表层土壤的吸热和保热性能被低估了。规律的时间特征表明大气再分析和陆面数据同化系统的表层土壤温度对高值表层土壤温度的模拟能力差。为了改善这种时间上的偏差特征,可以通过统计学对温度高值进行偏差订正,也可以通过改进陆面模式提高土壤的吸热性能来提高表层土壤温度的模拟值,减小再分析表层土壤温度的冷偏差。

2.3 代表站表层土壤温度变化分析

对再分析表层土壤温度的空间评估可知,表层土壤温度的误差有明显的区域特征,具体可以分为青藏高原、新疆地区、东北三省地区、华中华东华南大部分地区和东南沿海,在这些分区中多数站点表层土壤温度的平均误差、均方根误差和相关系数都表现出很大的相似。对再分析表层土壤温度的时间评估可知,在评估年份2010—2015年里,每一年再分析表层土壤温度的误差变化基本一致,没有出现不同年份之间明显的变化。所以,为了进一步研究这些典型区域表层土壤温度的误差特征,选取哈尔滨站、乌鲁木齐站、那曲站、武汉站和海口站,分别代表东北地区、新疆地区、青藏高原地区、华中华南地区和海南地区作为典型代表站,分析日平均表层土壤温度在2010年内的变化(图4),根据前文评估结果可知所选站点和年份均有代表性,同时避免了区域平均和多年平均抹去误差细节。

图4 2010年再分析日平均表层土壤温度在5个典型代表站点上的时间序列

在哈尔滨站,4—11月3种再分析表层土壤温度和观测接近,其中ERA-Interim稍微低估表层土壤温度。12月和1—3月,再分析低估表层土壤温度超过15 ℃;在乌鲁木齐站,4—11月EAR70和CLDAS和观测较为接近,ERA-Interim则低估2~10 ℃。12月和1—3月,3种再分析都低估5~15 ℃;在那曲站,EAR70和CLDAS在全年都和观测接近(ME为-1.1 ℃和-0.07 ℃,R为0.83和0.91),但是ERA-Interim在全年基本低估表层土壤温度1~7 ℃;在武汉站,再分析表层土壤温度和观测在全年都很接近;在海口站,再分析表层土壤温度和观测基本吻合,但是在5—11月里,观测表层土壤温度突然升高的时段,3种再分析都出现了低估,其中ERA-Interim效果最差。

联系再分析表层土壤温度误差指标的空间分布,哈尔滨站和乌鲁木齐站是负偏差大、均方根误差大但是相关系数高的地区。这两个站点所代表的东北和新疆地区的ME来源于两部分,一部分是春夏秋3季微弱的负偏差,另一部分是冬季巨大负偏差。东北和新疆地区是典型的冬季积雪区,再分析不能处理好积雪覆盖(积雪覆盖度的模拟和同化不准确、积雪冻融和隔热性能的模拟不准确等)是表层土壤温度模拟最大的问题。青藏高原上的那曲站,EAR70和CLDAS和观测很接近,这是由于CLDAS融合了青藏高原上一部分站点的气象观测,地面气象要素的精度提高了,驱动下边的陆面模式模拟的土壤温度精度也得到了提高。ERA-Interim则严重低估了表层土壤温度,而且变化幅度也小于观测,这和青藏高原地区地形复杂而ERA-Interim分辨率较粗有关,与其他学者的评估结果一致[32-35]。青藏高原是地形复杂地区,CLDAS融合地面观测站的气温、降水等观测数据来改善大气驱动精度的方法对提高土壤温度模拟很有效。武汉站代表着广大的华中华南地区,华中华南基本上是平原和丘陵地形,地形相对简单,3种再分析都能较好地模拟出表层土壤温度。海南为岛屿类型,EAR70和ERA-Interim表层土壤温度的相关系数降低明显,主要表现在表层土壤温度快速上升的时段,模拟的表层土壤温度上升速度远小于站点观测到的真实温度上升。

再分析表层土壤温度在不同地区精度差异明显,导致精度下降的原因不同。东北和新疆地区这些典型的冬季积雪区域需要着重改进冬季的模拟,去除系统性负偏差;青藏高原地区要着重改善地表气象要素初始值的质量;平原地区再分析模拟表层土壤温度的精度都高;岛屿地区(海南)需要改参数化方案来提高对土壤湿度快速上升的响应能力。

3 结论与讨论

本文使用2010—2015年2400余个中国地面气象站逐小时观测土壤温度,对EAR70、CLDAS和ERA-Interim表层土壤温度在时间和空间上进行了评估,并对5个区域代表性的站点进行细致分析,发现了不同地区再分析表层土壤温度具体的误差来源和解决方向。

(1)空间上,再分析表层土壤温度CLDAS精度最高(ME为-0.5 ℃,RMSE为3.0 ℃,R为0.96),EAR70精度稍差(ME为-1.21 ℃,RMSE为4.7 ℃,R为0.92),ERA-Interim最差(ME为-1.81 ℃,RMSE为4.7 ℃,R为0.93)。再分析表层土壤温度在空间上有明显的区域特征,主要表现为:青藏高原地区精度低,RMSE增大R减小;东北内蒙、新疆地区RMSE大但是相关系数R比较高,说明存在系统性的偏差;在华中、华东和华南组成的大面积区域中,再分析表层土壤温度精度都很高;再分析表层土壤温度表现为复杂地区精度低,北部冬季积雪区有冷偏差的基本特征,CLDAS通过融合地面观测提高大气驱动数据的质量来提高表层土壤湿度的模拟精度,但是在北部冬季积雪区,不仅仅需要提高大气驱动的精度,还需要改进陆面模式对雪的模拟或者加入积雪数据同化来减少土壤温度模拟值的负偏差。

(2)时间上,再分析表层土壤温度在06:00和夏秋季精度会明显下降。EAR70和CLDAS在04:00—06:00 RMSE增大到6 ℃和4 ℃,R降低到0.7和0.8以下。再分析表层土壤温度在土壤温度高值的时段(中国本地时间12:00和夏秋两季)出现低估,这种明显随时间变化的特征说明再分析在模拟过程中对土壤吸热能力估计不足,导致升温速度慢,最终导致和观测的真值之间出现较大差异。可以通过改进所使用的陆面模式(提高土壤的吸热性能,或者根据温度进行经验性的偏差订正)来改善再分析表层土壤温度的精度。

(3)在哈尔滨站(代表东北地区)和乌鲁木齐站(代表新疆地区),再分析表层土壤温度在冬季出现大的负偏差(ME小于-5 ℃),需要改进对积雪的处理;在那曲站(代表青藏高原地区),CLDAS因为融合了地面气象观测提高大气驱动气象要素的质量,提高了表层土壤温度的精度(R=0.91);在武汉站(代表着华中华南地区),地形简单地区再分析表层土壤温度精度都较高(R>0.95);在海南的海口站,再分析表层土壤温度在夏秋季里土壤温度骤升的时段模拟效果不好,模拟值变化幅度明显小于站点观测到的变化幅度,有必要在这些地区对再分析数据进行偏差订正或改进陆面模式的参数化方案。

(4)对于同化技术,CLDAS融合地面气象观测提高大气驱动气象要素的质量,进而提高了陆地表面各种参数的模拟精度。ERA-Interim由于尺度较粗,在青藏高原地形复杂地区的精度变低。EAR70结合CLDAS和ERA-Interim制备了一整套包括各种大气参数和陆面参数的数据集,其精度基本介于CLDAS和ERA-Interim之间。CLDAS的实时同化方式,能够有效提高在分析数据的精度。

本文研究还有几点不足,如:使用简单的空间插值方法,插值误差没有进行细致讨论;不同再分析表层土壤温度厚度轻微差别,带来的影响没有评估;没有加入更多新的再分析数据进行对比等。未来研究中可以根据本文发现的再分析表层土壤温度在时间和空间分区上的误差特征,对再分析数据进行偏差订正,或者调整模拟参数化方案及初始场数据。

猜你喜欢

土壤温度表层偏差
阿尔泰山森林土壤温度动态变化及其预测
50种认知性偏差
基于SHAW模型的青海湖流域土壤温度模拟①
路基基床表层级配碎石施工技术
如何走出文章立意偏差的误区
不同种植模式棉田土壤温度的时空变化特征
关于莫高窟第130窟“谒诚□化功臣”的身份问题——兼及表层壁画年代再讨论
表层
真相
地下滴灌葡萄园土壤温度的时空变化特征