APP下载

Google Earth Engine云平台对遥感发展的改变

2022-03-09王小娜田金炎李小娟王乐宫辉力陈蓓蓓李向彩郭婧涵

遥感学报 2022年2期
关键词:计算资源海量用户

王小娜,田金炎,李小娟,王乐,宫辉力,陈蓓蓓,李向彩,郭婧涵

1.首都师范大学水资源安全北京实验室,北京100048;

2.首都师范大学城市环境过程与数字模拟国家重点实验室培育基地,北京100048;

3.首都师范大学资源环境与旅游学院,北京100048;

4.美国纽约州立大学布法罗分校地理系,美国布法罗14261

1 引言

随着遥感技术的快速发展,遥感平台和传感器不断增加和改进,海量多源的遥感数据呈现出爆发式增长趋势(Tamiminia等,2020)。然而,本地计算资源(例如台式机或服务器)和数据分发方法(例如基于场景的影像下载)存在一定的局限性,导致传统桌面端遥感处理平台(例如ERDAS和ENVI等)难以满足遥感大数据快速处理与信息挖掘需要(Baumann 等,2016)。因此,遥感领域迫切需要一种新的科学范式。

为了弥补传统桌面端处理平台在海量遥感数据处理与分析方面的不足,21世纪以来,面向遥感大数据的云计算技术迅速发展。2011年,Moore和Hansen 在美国地球物理协会秋季会议上介绍了一种全新的云计算平台——谷歌地球引擎GEE(Google Earth Engine)。GEE 是由Google 公司与卡耐基梅隆大学、美国航空航天局NASA(National Aeronautics and Space Administration)、美国地质调查局USGS(United States Geological Survey)联合开发,属于“政产学研用”深度融合的产物。GEE 的本质是PaaS(Platform as a Service)云服务模式,用户仅需要通过简单的JavaScript 或Python编程向GEE 云端发送指令即可返回处理结果,数据、算法和硬件设施均由GEE 云端提供(董金玮等,2020)。到目前为止,GEE存储着近40多年来大部分公开的遥感影像数据,比如Landsat 系列产品、MODIS 系列产品、Sentinel 系列产品等,可以为用户提供全球尺度的遥感云计算服务。Goodchild 等(2012)提出,对地观测遥感数据的激增,催生了一种强调数据密集分析、海量计算资源以及高端可视化的“大数据”科学范式,而GEE 在很大程度上满足了这一需求。2013年,GEE 开始在遥感行业内崭露头角,并积极开展与学界的合作。Hansen 等(2013)将GEE 运用于全球森林分布和变化监测,这一研究成果足以证明GEE 在海量遥感数据处理与分析方面的巨大潜力。Wulder 和Coops(2014)的研究中也提到,GEE 提供的并行计算服务对于海量遥感数据的快速处理功不可没。Gorelick 等(2017)首次全方位、深入地介绍了GEE 云平台,他们提出作为海量遥感大数据的强大分析工具,GEE 以其集大数据/云计算为一体的特点,彻底改变了人们对地球的传统理解和研究方式。截至今日,GEE 已成为当前领先的、应用最为广泛的遥感云计算平台(Wang 等,2020a)。

除了GEE 云平台以外,还有一些其他的遥感云计算平台。例如AWS(Amazon Web Services,https://aws.amazon.com/[2021-05-12])、MA(Microsoft Azure,https://azure.microsoft.com/[2021-05-12])、Data Cube(http://www.datacube.org.au/[2021-05-12])、NEX(NASA Earth Exchange,https://nex.nasa.gov/nex/[2021-05-12])、Planetary Computer(https://planetarycomputer.microsoft.com/[2021-05-12])、Descartes Labs(https://www.descarteslabs.com/[2021-05-12])、EarthCube(https://earthcube.org/[2021-05-12])、Grid Processing on Demand(G-POD,http://gpod.eo.esa.int/[2021-05-12])、EarthServer(http://earthserver.eu/[2021-05-12])以及中国的EarthDataMiner(http://earthdataminer.casearth.cn/[2021-05-12])和PIE Engine(https://engine.piesat.cn/engine/#/home[2021-05-12]),这些平台都为遥感大数据分析提供了有效的云计算服务,但是相比于GEE 往往存在一方面或多方面的不足,例如:存档数据不够丰富、硬件设施性能低、处理算法不灵活或者开放程度不高等问题。

GEE 的出现为海量遥感大数据的快速处理提供了前所未有的发展机遇(付东杰等,2021)。自2017年以来,利用GEE 所开展的研究工作数量激增(Tamiminia 等,2020)。2017年—2020年,已有Gorelick 等(2017)、Kumar 和Mutanga(2018)、Mutanga 和Kumar(2019)、Tamiminia 等(2020)以及Amani等(2020)发表了5篇关于GEE 平台的综述性研究。同时,科研人员也利用GEE 开展了大量相关工作,以Nature(含子刊)、Science(含子刊)和美国国家科学院院刊(PNAS)为主期刊上发表的代表性文章为例,GEE 已被广泛应用于全球森林变化(Hansen 等,2013)、全球地表水变化(Pekel 等,2016)、全球滩涂变化(Murray 等,2019)、地貌(Ielpi 和Lapôtre,2020)、城市(Liu等,2020)、油棕(Ordway 等,2019)、动物栖息地(Joshi 等,2016)、物候(Laskin 等,2019)、碳循环(Badgley 等, 2017)以及人类健康(Macdonald 和Mordecai,2020)等众多研究领域。此外,Wang 等(2020a)最先在Remote Sensing of Environment 期刊上组织编辑了主题为“Remote sensing of land change science with Google Earth Engine”专刊,旨在揭示GEE 将如何推进土地变化科学的研究进展,并且Remote Sensing、遥感学报和Journal of Remote Sensing 3 大期刊也相继推出“遥感大数据云计算”相关主题专刊。Wang 等(2019)和董金玮等(2020)还分别编著了关于遥感云计算基础理论与应用实践的著作。

然而,迄今为止,还没有一项研究系统地分析相比于传统桌面端遥感处理平台,GEE 云平台对遥感发展带来了哪些改变。通过系统归纳总结GEE 平台的优势,将有助于:(1)帮助潜在的零基础用户了解GEE,为新用户入门提供参考与借鉴;(2)加深现有用户的理解,更好地挖掘GEE面向海量遥感大数据的潜力;(3)促使谷歌开发人员进一步完善和改进GEE;(4)促进更大时空尺度的遥感数据向知识转化,催生出地球系统科学研究的新发现。因此,本文旨在探讨相比于桌面端遥感处理平台,GEE 云平台分别在海量数据库与计算资源(第2 部分)、遥感分析新方法(第3 部分)以及遥感应用新范式(第4 部分)3 个方面的创新性变革及其如何推动遥感科学发展。

2 海量数据库与计算资源

2.1 海量数据库

传统桌面端遥感处理平台(例如ERDAS 和ENVI 等)无法提供在线存档的数据资源,所以在处理与分析之前,用户需要花费大量时间采集和存储数据。GEE 作为一个基于云的遥感大数据处理平台,集成了超过40 a、当前被广泛应用的大规模遥感影像,例如Landsat、MODIS、Sentinel 等系列产品,还包括诸如地形、气候天气、土地覆盖、人口统计和其他环境数据,可供用户快速调用海量在线数据资源,实现全球尺度的地理空间分析。图1 展示了GEE 的主要共享数据集。由于数据存储比计算的成本更高,所以大多数现有数据的衍生产品(例如归一化差异植被指数)都是根据用户需求动态计算的(Amani 等,2020)。目前,GEE 提供的数据总量已经超过30 PB,并且数据还在以每天近6000 景的速度持续增加(Wang 等,2020b)。除了在线公开的数据源,用户还可以根据需要上传私有数据(例如高分辨率遥感影像等)以供后续分析。GEE 数据集的访问地址如下:

图1 GEE的主要共享数据集Fig.1 The primary shared dataset of GEE

https://developers.google.com/earth-engine/datasets/[2021-05-12]。

2.2 计算资源

相比于传统桌面端遥感处理平台,GEE 云平台可以避免大量的本地计算过程,显著降低了需要投入的硬件成本(曹博文等,2021)。随着遥感数据量不断增大,数据密集型计算任务变得日益繁重,不断涌现的海量数据需要大量计算资源,但本地台式机的运算能力难以满足这一需求(吴炳方等,2016)。GEE 依托于Google 数据中心的云端分布式计算集群,在保留原始信息(例如投影和分辨率等)的前提下,预先将影像切分为256×256 像素大小的瓦片存储,然后分发至数以万计的计算机上并行处理(Gorelick 等,2017),极大地提升了海量数据处理与可视化效率(Xiong 等,2017)。例如,Hansen等(2013)使用GEE 仅花费100 h就处理了654178幅Landsat 7影像(约707 TB)并绘制了连续12 a 的全球森林分布图。他们的研究成果引起了遥感学界和公众的广泛关注,如果不依托于GEE 强大的计算资源,整个过程将耗费不少于100 万个小时(Amani 等,2020)。GEE 的并行分布式计算过程如图2所示(修改自David Thau 主题为“Global-scale analysis of Earth observation data”的报告)。

图2 GEE并行分布式计算过程Fig.2 Parallel distributed computing process of GEE

此外,GEE 在算法方面具有更高的定制化能力和可扩展性,可以为不同需求的用户提供更多选择。传统桌面端遥感处理平台,例如ENVI 通常使用IDL 语言(Interactive Data Language)进行二次开发和功能扩展,需要用户掌握网络编程方面的专业知识。然而,GEE 提供了JavaScript 和Python API(Application Programming Interface),用户能够通过API 直接调用GEE 存档的数据及专门针对这些数据开发的算法,允许用户创造性地重新组合现有算法,实现快速、交互式算法开发(Gorelick 等,2017),同时,GEE 还支持灵活地将算法移植并应用到区域或者全球范围。此外,GEE 还提供了大量的函数,例如数值运算Numerical operations、数组/矩阵运算Array/matrix operations、机器学习Machine learning、其他逐像素影像操作、核运算Kernel operations、其他影像运算Other Image Operations、数据重组Reducers、几何运算Geometry Operations、表格/集合运算Table/collection operations、矢量/栅格运算Vector/raster operations 以及其他数据类型Other data types 共11大类(付东杰等,2021)。

3 遥感分析新方法

3.1 像元级分析方法

3.1.1 影像预处理

相比于传统桌面端遥感处理平台,GEE 云平台能够显著提高影像预处理的效率(Tamiminia等,2020)。尽管传统处理平台也可以实现影像预处理的完整流程,但在此之前,用户需要提前下载特定研究区内的大量数据,非常耗费时间、占用网络带宽和存储资源。然而,GEE 提供了一种海量在线遥感数据的快速调用方法,在预处理之前,用户就可以节省大量的数据获取和管理时间。对于影像预处理的过程,GEE 允许用户直接调用经过标准预处理(例如辐射定标和大气校正等)的地表反射率SR 数据,避免了大规模影像预处理的繁杂过程,解决了不同数据之间配准、投影等预处理难题,为之后的处理与分析工作带来极大便利(郝斌飞等,2018)。同时,GEE还支持用户灵活使用由专业人员自主开发和共享的预处理工具,例如Py6S 大气校正模型(Sam,2018),工具链接如下:https://github.com/samsammurphy/gee-atmcorr-S2[2021-05-12]。此外,在影像去云方面,利用传统处理平台进行去云的过程相对机械化,难以实现大尺度海量遥感影像的快速处理。然而,GEE凭借高性能集群服务器的计算资源,极大提高了影像去云的处理效率和灵活性。这里以Sentinel-2影像为例。一方面,用户可以使用基于场景的去云方法,即通过GEE 提供的CLOUDY_PIXEL_PERCENTAGE 算法直接去除云覆盖率大于特定阈值的所有场景;另一方面,为了避免遥感影像中少数云像素的影响,用户可以对影像质量波段QA60(Quality Assessment)进行按位运算,自动识别并掩膜去除云像素(Jia 等,2021d),然后再利用GEE 像元级分析方法重新组合影像上的所有可用像元,对缺失的云像素位置进行填补。该过程不但提高了遥感影像的利用率,还可以得到理想的无云合成影像,这是传统桌面端遥感处理平台无法实现的。

3.1.2 影像重组

传统桌面端遥感处理平台采用固有的基于场景的分析模式(Yin 等,2013)。然而,这种方法在大尺度应用中容易受到恶劣环境因素(例如云、雪等)的影响,极大削弱了可用遥感影像的数量(Phan 等,2020)。例如,Landsat 8 卫星对地球上同一地点的重访周期为16 d,这意味着在6 个月内每个地点至少会有约12 幅遥感影像(场景重叠的地方将会更多)。如果使用基于场景的分析方法,尤其对于云层频繁覆盖的地区,6个月甚至更长的时间窗口内可能也难以找到一幅完整的无云影像(Tian 等,2017)。然而,GEE 旨在将单个像素作为分析单元,充分考虑影像集所有的可用像素(例如无云、低潮位),同时也包括云覆盖影像中的可用像素,然后按照一定的重组规则进行逐像元重新组合(Tian 等,2020)。这种像元级影像分析方法缓解了因云覆盖等因素导致的数据缺失问题,极大地提高了海量遥感数据的利用率,从而为大尺度遥感应用研究提供重要的数据支撑。

GEE 提供的像元级重组规则主要包括最小值、最大值、平均值、中位数和百分位数等(Phan 等,2020)。其中,最小值法可以有效去除高值的云像素,但会因此保留低值的阴影;最大值法能够避免低值的阴影,但无法忽略高值的云像素影响;相比来说,中值法能够同时满足云(高值像素)和阴影(低值像素)影响的最小化,因此在大尺度遥感研究中应用广泛(Bey 等,2020),同时还可以得到较高分类精度(Johnson,2019; Phan等,2020)。

虽然GEE 提供的像元级重组方法具有较强的鲁棒性,但它们都属于数据驱动的重组方法,仍然不能满足所有的研究与应用需求。近年来,研究人员趋向于探索具有特定物理含义的、知识驱动的重组方法。例如Tian 等(2020)使用融合物候知识的像元级重组方法进行入侵种互花米草的监测研究。首先,确定了最适合互花米草制图的两个关键物候期(生长期和衰老期)。然后,以EVI(Enhanced Vegetation Index)最大值和PSRI(Plant Senescence Reflectance Index)最大值作为限制条件,进行时间序列Landsat 影像原始波段的像元级重组,进而获取生长期影像和衰老期影像。最后,叠加两个关键期影像并结合机器学习分类器进行互花米草制图。两幅合成影像的重组过程如图3所示,图中用绿色和黄色分布代表处于生长期和衰老期的互花米草。这种方法既能保证物候知识的丰富性,有效提高分类精度,还能缓解数据缺失问题带来的影响。此外,Richards和Belcher等(2019)还利用NDVI 的百分位数构建重组规则,生成全球植被覆盖的空间分布图。由此可见,GEE 的像元级重组规则突破了传统遥感技术瓶颈,极大提高了海量数据处理和分析效率,能够满足不同用户的研究与应用需要。

图3 生长期影像和衰老期影像的重组过程Fig.3 The composition of a green composite image and a senescence composite image

3.2 基于云平台的人工智能

中国对地观测进入了一个新的纪元,对海量数据智能化分析和信息挖掘提出了很高的要求,因此,亟需在智能算法方面开展遥感大数据处理的创新性研究。近年来,人工智能的发展日新月异,为遥感大数据智能处理与认知创新带来了新的契机。将人工智能技术和对地观测大数据进行有机结合,有助于提高遥感数据处理的时效性与智能化水平(李德仁,2018)。作为面向遥感大数据的云计算平台,GEE 就是在这一背景下发展起来的数据—计算—服务一体化的遥感服务新模式。相比而言,传统桌面端遥感处理平台虽然支持人工智能算法(赵忠明等,2019),但受限于存储和计算资源,难以实现海量遥感数据与人工智能技术的深度融合,无法为用户提供遥感大数据处理与信息挖掘服务。因此,GEE 的出现促使人们投身于遥感大数据、云计算与人工智能的集成创新研究,为海量遥感数据的智能处理与信息挖掘带来突破性进展,推动遥感服务向便捷化、智能化的方向转变。GEE 可以集成实现各种人工智能算法模型的在线调用。其中,机器学习作为实现人工智能最常用的方法(曹博文等,2021),在GEE中已被广泛运用于遥感影像的分类研究(Tamiminia 等,2020)。过去的研究表明,深度学习算法比传统的机器学习方法在影像识别精度方面更占据优势,因此得到了遥感学界的广泛关注(Maggiori 等,2017)。自2019-09 起,GEE 支持与深度学习TensorFlow 模型相耦合(DeLance 等,2019),这标志着遥感云计算平台与大数据驱动的深度学习等人工智能方法进一步集成,极大提高了海量数据服务于遥感科学研究的价值与效率(周岩和董金玮,2019)。然而,目前在GEE 上快速实现深度学习算法仍然面临较大困境,有望成为未来GEE的发展方向。

近年来,越来越多的云服务提供商,例如百度智能云、阿里云、腾讯云、华为云都相继投入人工智能和云平台深度融合的建设中来。其中,作为国内人工智能行业的先行者,百度智能云(https://cloud.baidu.com/[2021-05-12])率先打造出AI-Native 云计算服务,旨在让云平台和人工智能进行深度结合,最大化发挥云计算性能。此外,微软于2017年发起的“AI for Earth”倡议致力于通过结合云与人工智能技术,帮助环保组织解决各种环境问题。Cloud Agronomics(https://www.cloudagronomics.com/[2021-05-12])就是在这一背景下合作催生的产物,旨在通过改变农业决策方式促进可持续粮食生产。Planetary Computer 作为“AI for Earth”项目的延伸,旨在利用全球环境数据帮助人们更好地理解所面临的环境挑战,推动全球可持续发展。因此,未来人工智能与云平台加速融合已成为必然。

4 遥感应用新范式

4.1 扩展时空尺度

遥感卫星数据采集技术的迅速发展,带来了对地观测遥感数据的爆发式增长。遥感大数据具有海量数据特点,数据量极其庞大并且还在不断扩展与更新,数据来源的多样性以及时空维度语义的丰富性为开展大范围、长时间序列的应用研究带来了新的契机(何国金等,2018)。面对大范围、长时间序列遥感数据的处理与分析,传统桌面端遥感平台在海量数据处理能力和处理方法上的局限性导致全球变化研究存在很大的不确定性(李德仁等,2014),难以挖掘遥感大数据隐含的巨大价值,形成数据海量、信息缺乏、知识难觅的困局(李德仁,2016)。

然而,云计算平台的发展对传统遥感研究形成了强烈冲击,革命性地拓展了遥感大数据的应用范围和时空尺度,为全球尺度的长时间序列快速分析与应用提供了全新机遇(郭华东,2014)。GEE 支持海量遥感数据的免费开放服务,并建立在Google 高性能计算资源支持之上。已有研究表明,在GEE 上处理184500幅Landsat影像仅需要花费不到8 h 的时间(Mueller 等,2016),极大提高了海量遥感数据的分析与处理效率(周岩和董金玮,2019),使得传统遥感平台难以实现的全球尺度、长时间序列快速分析与应用成为可能(付东杰等,2021)。此外,考虑到遥感大数据利用的终极目标在于对其时空维度上隐含知识的深入挖掘(李德仁等,2014),集成多源的长时间序列影像对于监测人类活动所导致的地球动态变化具有重要意义。GEE 不但可以快速地提供表征全球范围内地表信息的长时间序列影像,还扩展了人们观察并追踪其时空动态的能力,有助于揭示大范围事件的发展趋势与变化规律(吴炳方等,2016),实现从遥感数据到知识的快速转化(李德仁等,2014)。

GEE 在大范围、长时间序列遥感分析与处理方面具有明显优势,已有许多研究者使用GEE 开展了相关应用研究。例如,Hansen 等(2013)实现了21世纪以来连续12 a 的全球森林分布制图,帮助人们了解全球范围内森林损失和再生长过程。Gong 等(2020)绘制了连续34 a 的全球人工不透水面分布图,这对于探究城市化、土地变化及其对生物多样性的影响至关重要;Dong 等(2016)发布了东北三省30 m 水稻空间制图产品,可以作为粮食安全评估、水资源管理、温室气体排放和疾病控制的基础参考;Weiss 等(2018)绘制了从全球任何地点到最近城市中心的出行时间地图,可以为公共卫生及相关服务部门提供管理与决策支持。由此可见,GEE 的应用已走出传统遥感范畴,并逐渐走向更大尺度乃至全球范围的生态环境、土地利用以及人类社会经济活动等研究领域,促进了人们对于全球地表变化的深入理解。

4.2 扩大用户群体

GEE 的出现降低了遥感数据处理与分析的技术门槛,推动了遥感应用快速从专业化向大众化的方向发展(Tamiminia等,2020)。近年来,尽管大量遥感数据对公众免费下载,但对非专业用户而言,如何使用这些海量数据资源仍是其面临的主要障碍。首先,传统遥感研究在数据获取方面需要花费大量精力,难以实现零基础用户的高效访问。同时,传统的方式需要大量计算资源(例如硬件设备和商业软件)的投入,极大限制了普通用户开展相关研究。谷歌公司推出GEE 的目的并不在于开发一种类似于ENVI 的专业遥感图像处理软件,相反,它的设计初衷是构建一种面向地学科研人员的工具,把科学家从海量数据中解放出来,将更多精力用于算法研发和应用。GEE 作为一个综合性公共平台,能够为科研人员、教育工作者、非盈利性研究机构以及政府部门提供免费数据处理和分析服务,同时,让没有编程经验的非遥感专业用户即使在很少的人工干预下,也能够很好地利用GEE 解决其领域内的科学问题(Gorelick 等,2017)。因此,GEE 降低了遥感数据处理和分析的专业门槛,节省了巨大的人力与硬件资源,吸引了不同行业的普通用户参与遥感研究和应用。然而,对于中国来说,GEE 自从进入中国便迅速占领国内市场,快速聚拢遥感行业用户资源,在相关领域已经处于垄断地位。

4.3 推动开放共享

GEE 通过促进用户之间的交流协作,进一步推动了数据、产品和算法的开放共享(Gorelick等,2017)。传统遥感研究面临的数据共享不足已成为制约其发展的重要瓶颈,不同行业的遥感用户经常会受到信息共享不畅的问题困扰。相比之下,GEE 致力于推动对地观测数据开放共享服务,提高科研人员的共享积极性,不仅向联合国相关机构或国家等非营利组织提供相应的数据、方法和决策支持,同时还积极开展商业合作,加速推进遥感信息和技术资源整合,不断扩展自身影响力并巩固其市场地位。具体来说,GEE 提供了多用户之间的信息交流与合作方式。用户自主开发的脚本及研究用到的数据,其中,不仅限于海量遥感卫星影像,还包括其他反映地理空间信息的大规模非遥感数据,例如地形、气候天气、土地覆盖、人口统计和矢量数据等,都可以对合作者或者公众方便地进行共享。例如,开发的算法可以通过产生URL 链接发送给其他用户,帮助他们快速重现过程以做进一步改进,而无需提供源代码,并且产生的数据集可以通过建立ID 方便其他用户检索和使用,这为开展关于数据应用和算法研究的交流与协作提供了极大便利(付东杰等,2021)。同时,用户还可以通过Earth Engine Apps(https://www.earthengine.app/[2021-05-12])发布自己的应用程序,GEE 也提供了相关的典型应用展示,例如全球森林观察(Global Forest Watch)(https://www.globalforestwatch.org/[2021-05-12])、生命地图(Map of Life)(https://mol.org[2021-05-12])、全球地表水制图(https://global-surface-water.appspot.com/,aqua-monitor.appspot.com[2021-05-12])、在线土地覆被制图(Re-Map)(https://remapapp.org[2021-05-12])以及全球可达性制图(https://access-mapper.appspot.com[2021-05-12])等。此外,用户还可以在官方论坛上直接与GEE开发人员、遥感专业人士共同探讨科学问题并分享使用经验,极大促进了GEE 用户之间的深入交流(Alonso 等,2016),官方论坛的地址如下:https://groups.google.com/forum/#! forum//google-earth-enginedevelopers[2021-05-12]。

5 结论

海量对地观测遥感数据的不断涌现,对数据存储和计算能力提出了很高的要求,传统桌面端遥感处理平台难以满足大规模遥感数据快速处理与分析的需求。遥感云计算平台的快速发展为突破传统遥感技术瓶颈提供了一种有效途径。作为目前应用最为广泛的遥感云平台,GEE 通过集成海量数据资源和高性能云端服务器,让用户无需面临数据获取、存储与计算资源方面的压力,而是更加专注于遥感理论模型和应用方法的研究,极大提高了海量数据处理与信息挖掘效率。本文总结归纳了相比于传统桌面端遥感处理平台,GEE 云平台在海量数据库与计算资源、遥感分析新方法以及遥感应用新范式3 个方面的创新之处,深入分析GEE 云平台如何推动传统遥感的快速发展,有助于未来人们更好地挖掘GEE 潜能,使其成为解决地球科学问题的重要工具。

遥感云计算平台的出现为突破传统桌面端遥感处理平台的技术瓶颈提供了前所未有的发展机遇。然而,目前GEE仍然存在一些局限性。

(1)GEE 的数据和计算资源并不是无限的。虽然GEE 存档了丰富的数据资源,但依旧不能完全满足当前的应用需求。例如,地表反射率SR 产品和高分辨率遥感影像的数量非常有限,在一定程度上限制了相关研究的发展进程。此外,部分算法的实施仍然具有挑战性。GEE 对于海量矢量数据的运算以及基于对象的影像分析优势并不显著(Tamiminia等,2020)。同时,GEE目前无法提供在线的Python API,然而Wu(2020)开发的Geemap Python 软件包填补了这一空白,极大提升了使用Python API 的GEE 用户的体验,在未来具有很大的应用价值与发展潜力。

(2)GEE 的像元级分析方法仍然有待深入挖掘。例如,在Tian 等(2020)的研究中,尽管已对所有影像进行基于场景和像素的去云处理,但合成的影像仍然不可避免地受到薄云和阴影的干扰。因此,未来有望深入探究GEE 面向不同遥感应用的像元级重组方法,为挖掘更多新的地球知识与变化规律提供技术支撑。

(3)GEE 推动对地观测大数据的开放共享使得遥感应用与服务进入崭新阶段,在发挥更大数据价值的同时,也暴露出很多挑战和亟需关注的安全问题。伴随物联网、云计算、人工智能等技术的快速发展,数据资源获取的自动化程度不断提高,也进一步提升了不同数据关联融合、深度加工以及智能化分析能力。相较于传统的网络应用,在云端进行存储和处理会导致用户数据的所有权与管理权分离。为了利用GEE 的存储和计算资源,用户需要将数据存储到云服务器或者将计算任务外包给云服务器,这将泄露用户的敏感数据和计算结果。即使个人上传的碎片化数据包含的信息有限,但对其进行加工处理和多源汇聚时,多维度数据不断碰撞融合将识别出海量高价值信息,存在极大的、不可逆的安全隐患。因此,一方面,研究人员利用GEE 开展遥感研究,需要进一步提升对地观测数据的使用规范,谨慎对待涉密数据的云端存储和计算任务。另一方面,未来中国应该注重自主研发安全可控的遥感云计算产品,打破长期以来国外技术垄断与封锁、国内市场缺失GEE 竞品的困局。近年来,中国的EarthDataMiner 和PIE Engine 等遥感云计算平台已经取得重要进展,加速了中国自主可控遥感云计算服务的发展,尤其在国产卫星数据服务方面独具特色。

需要注意的是,本文仅从遥感影像数据方面分析GEE 云平台对遥感发展的改变,除此之外,GEE 还存档了其他海量地理空间数据。虽然关于GEE 云平台在资源、方法及应用方面的优势介绍并不全面,但有望为即将入门或者正在使用GEE的用户进一步了解与探索GEE潜力提供参考。

猜你喜欢

计算资源海量用户
基于用户和电路的攻击识别方法
2021少儿出版用户触达能力指数
浅谈信息产业新技术
一种作业调度和计算资源动态分配方法
信用卡资深用户
基于云桌面的分布式堡垒研究
一个图形所蕴含的“海量”巧题
高校信息资源虚拟化技术的应用与实践
从教材中突围,走课内海量阅读之路
Hadoop构建的银行海量数据存储系统研究