从地理规律到地理空间人工智能

2022-07-05李海峰董卫华

测绘学报 2022年6期

刘瑜，郭浩，李海峰，董卫华，裴韬

1.北京大学遥感与地理信息系统研究所，北京 100871；2.北京大学人工智能研究院，北京 100871; 3.中南大学地球科学与信息物理学院，湖南长沙 410083；4.北京师范大学地理科学学部，北京 100875；5.中国科学院地理科学与资源研究所资源与环境信息系统国家重点实验室，北京 100101

1 地理异质性和地理规律性

地理异质性是地理学科存在的基础，因为地理学的最初目的就是为了描述不同地理单元的人文与自然属性。近代以来，该传统被康德、赫特纳、哈特向等一直强调，形成了地理学研究源远流长的区域传统。如康德指出，地理学研究特定具体事物中的关系，而不是事物抽象的一般特性，并且集中注意力于自然的差异性，而不是相似性[1]；哈特向则认为“地理学关心的是提供地球表面各种性质精确的、有条理的、合理的描述与解释”[2]。然而，如果地理学的目的仅是为了描述不同地理要素的空间分布，那么它很难成为真正意义的现代科学，而更像是博物学。这一点，与其他地球科学(如地质学)相比存在很大区别。尽管后者也是试图去描述人类独一无二的家园——地球，但是由于其研究对象的时空尺度通常大于地理学，因此存在太多的未知现象作为其研究目标，从而符合科学的“探索未知”属性。作为对比，地理学的研究对象分布于人类最为熟悉的地球表层。地理大发现的时代早已过去，人类的足迹已经遍布地表的各个角落，遥感技术又为全面、高分辨率认识我们的星球提供了有力的技术手段。因此，如果地理学还是停留于描述地理事物和现象的空间分布，则其学科价值将大大降低。

在此背景下，地理研究产生了对于一般性地理规律、地理法则探索的需求[3]。其意义一方面在于帮助人类理解地理分布及其演化背后的驱动机制；另一方面，从地理空间的角度也有助于在不同地理单元间迁移知识，从而做出正确预测。在以物理学为代表的现代自然科学中，对称性被认为是物质世界所遵循的基本规律之一。如果一条地理规律具有时空平移对称性，则可以被认为是一般的普适性规律，并且具有可复现性(replicability)[4-6]。可复现性使得用户可以将在给定地区发现的规律和法则应用于另一个地区，并与当地具体情况相结合，从而得到关于该地区的新的知识。例如，将一个区域分析得到的坡度、岩性、植被覆盖等参数与滑坡风险之间的定量关系，迁移到新的区域，并对该区域的滑坡风险进行评估和制图，这正是地理学研究的意义所在。这种研究范式蕴含了一个地理事实：对于特定感兴趣的地理变量，其影响变量的空间环境配置越相似，则该变量的值越接近，该事实被文献[7]用地理学第三定律加以概括。

对普适性规律的追求，有两个方向的产出。第1类偏于机理揭示，这类规律通常是基于现象的空间分布，运用其他领域的法则，解释所观测到的空间分布模式。例如，不同类型土壤的空间分布，促使土壤学家从母质、气候、植被等要素出发，利用物理的、化学的、生物的规律，解释不同类型土壤的成因。很明显，这些规律本身与空间无关。上述研究范式使得不同地理要素研究的学科脱离地理学，是造成地理学空心化的主要原因。第2类称为唯象模型，它试图形式化地理现象的空间分布模式，或在空间框架中构造“黑箱化”的解释[8]。一个典型的例子是预测空间交互的重力模型，其中引入了刻画空间最重要的参数——距离。而重力模型已经被广泛应用于如四阶段法交通流规划的应用中，说明了该模型的普适性。

在地理学中，关于特殊性和规律性对立的讨论由来已久，而舍费尔与哈特向之争是体现这个对立的重要事件[3,9]。舍费尔主导的方向即对地理例外论的批判，在一定程度上推动了计量革命的出现。计量革命时代的成果与同时代计算机技术相结合，推动了地理信息系统的进步[10]。值得指出的是，地理信息系统在继承计量革命成果的同时，也在积极吸收相邻学科的成果，典型的如源于地质学的地统计学[11]。

地理信息系统通过提供丰富的空间分析工具，体现了具有一般性的地理规律。插值方法可以视为一类空间预测手段，有很多具体的实现方式，如距离倒数权重方法，被广泛应用于DEM数据的生成，而与数据分布的具体区域无关，换言之，距离倒数权重插值方法所形式化的地理规律是普适的。具体而言，它正是实现了Tobler地理学第一定律所陈述的空间邻近对于地理现象属性分布的影响。此外，GIS支持下的分析方法兼顾了地理特殊性和规律性，如地理加权回归[12]，也体现了地理学研究在特殊性和普遍性之间的折中[13]。

考察地理现象的空间分布特征，有助于理解空间异质性和普遍规律性之间的关系。图1(a)、(b)展示了某区域的高程及人口密度分布，两种数据都很“自然”，地理空间分析中经常会处理这类数据。它们表达了不同地理现象的分布，体现了空间异质性。然而，如果仔细观察会发现，它们并不是完全无规律的。在数字高程模型中，空间上相近的区域，高程(或坡度、坡向)也相似，从而使得我们能够很容易识别出一些有意义的面状地形单元，如山脊、山谷等；同样的，在人口分布中，也很容易发现一些高密度的城市化区域。这种地理现象的分布特征被托布勒地理学第一定律所刻画，即大量地理现象的分布呈正的空间自相关。空间自相关对于地理研究和空间分析方法构建的意义至关重要。为了阐述这一点，可以假定一种极端的情形，即对于某种地理现象，不存在空间自相关。如图1(c)所示，任意一点的属性都与周边位置的属性差异很大，这使得不可能识别出区内相似程度较高的地理单元，并进行归纳总结，进而提取有意义的分布模式。同样地，对于这种极端分布的地理现象，很多分析方法(如空间插值)不再有效，因为无法根据已知周围点的数值，内插得到一个未知点的数值。大量地理研究的目标是对特定区域进行区划，而能够进行这种分析，正是由于在空间异质性的基础上存在受距离影响的相对的相似性。值得指出的是，地理现象的空间分布也不是完全规则的(图1(d))，如果地理现象分布可以用简单的数学函数表达，地理学家的任务将变得异常简单，这样地理学存在的意义也将大大降低。正是由于真实的地理现象分布是两种极端情形的中间状态，给地理分析带来了复杂性和难度，也使得地理信息系统的实现要兼顾特殊性和一般性。

图1 真实的地理现象分布和虚拟的地理现象分布

2 地理规律的扩展和泛化

科学研究的目的是发现科学规律，大量的科学规律，尤其是物理学中的规律是确定性的，并且可以表达为数学公式，如牛顿第二定律F=ma。确定性规律的优势在于可以准确做出预测，并且能够验证；当发现反例时，就需要否定相应的规律，或对规律进行修改。通常对规律进行修改的方式是对其进行扩展，使其能够容纳反例。假定有两条规律L1和L2，形式化为L1:∀x∈S1,P1(x)和L2:∀x∈S2,P2(x)，如果L1的论域S1是L2论域S2的子集，即S1⊆S2，而谓词P1(x)蕴含P2(x):∀xP1(x)→P2(x)，则L1表达了比L2更特殊的规律，而L2是L1的扩展和泛化。规律扩展的一个经典例子就是牛顿力学和爱因斯坦相对论之间的关系，前者可认为是后者在低速运动系统中的一个近似。

当然，一个规律也可以用定性的方式表达，这在社会科学中尤为常见，地理学第一定律也采用了定性的方式描述，其中的“距离近”“关联性强”定性表达了程度的强弱。一条定量的规律可以扩展为定性方式的表达。如给定两个变量x和y，假定有如下3条描述其关系规律的谓词：P1:y=2x，P2:y和x正相关，P3:y与x相关，很明显有P1→P2→P3。定性规律的缺点是难以基于它进行预测，如根据“y和x正相关”和给定的x值，无法确定y的数值。然而定性模型的优势在于其泛化能力，即适用范围通常更广。定性规律相对宽松的表述使得寻找反例并打破规律变得困难。尽管预测能力相对较弱，定性模型依然可以帮助我们理解一个系统背后的关键驱动因子，从而提供可理解性。因此，尽管我们认为一个好的规律应该兼具预测性和可理解性，像物理学中大部分规律那样，但是预测性和可理解性分离的法则也应该是可以接受的[14]。

人类智能具有很强的归纳、泛化、类比能力，从而能够发现规律，学习知识。梭罗认为“所有对于真理的认识都是通过类比得来的”。由于泛化和类比能力，人们很容易将基于个体得到的知识恰当地泛化到一个类别；或从一个小的类别泛化到大的类别。例如，一个人吃到美味的水果后，得到的知识通常不局限于“这个水果”好吃，而是“这一类水果”好吃。当我们在地理空间的框架下去理解上述泛化学习过程时，就形成了地理研究的基本方法论：从描述局部的地理现象分布开始，得到局部的规律，进而对规律进行扩展，使其能够泛化到更多的区域，从而得到更一般的乃至全局的普适规律。当然，一个过于泛化的法则可能在实践中没有价值，我们可以控制规律扩展的约束，使其仅适用于局部，从而形成泛化边界。

地理学关注区域特性，较少将地球作为一个整体研究。因此，基于上述框架，可以重新认识地理学的空间异质性和规律性。由于空间异质性，普适的地理规律相对而言难以构建。然而，在不同的位置可以有相应的局部规则，只要该规则在一个足够大的空间范围内适用，我们就可以应用它进行空间预测。尽管如此，这并不意味着寻求普适的一般性规律是不可能的任务。只要我们对规律进行扩展，即使这样的规律从进行预测的角度而言价值不高，但是依然可以帮助我们认识时空模式及影响因素，从而具有高的可理解性。从这个角度，托布勒第一定律是一条完全合格的规律——尽管它不是直接表示为数学公式。但是在不同的区域，针对不同的目的，它可以指导构建不同的数学模型，如距离倒数权重插值[15]。

此外，需要指出的是，大部分地理研究并没有天然的分析单元。在一个区域得到的规律，依赖于该区域的空间单元划分方式，从而产生了可变面积单元问题(modifiable areal unit problem,MAUP)[16]，尤其是基于空间延展型变量进行的分析，MAUP问题更为明显。此外，不确定性地理语境问题(uncertain geographic context problem)[17]同样也会影响所建立的模型。这进一步增加了发现普适性法则的难度：即使针对同一研究区域，也会得到不同的规律。哪条规律更为正确取决于空间单元的划分及空间语境的确定。

因此，讨论一条地理规律时，需要同时确定其谓词的泛化性，以及适用的空间范围和相应的空间配置参数，如空间划分方式和空间语境。同样的，讨论地理发现的可复现性时，需要考虑对于规律的扩展和泛化。一条严格的规律，如果通过扩展，适当放松其定义，就可以在更大的空间范围或另一个场所再现，这可以称为一种“弱可复现性”[18]。

3 地理规律可复现性与地理空间智能

地理空间人工智能(GeoAI)是地理学与人工智能交叉的研究领域，致力于引进最新的人工智能技术方法，提升地理科学的研究能力[19-20]，并延伸至地理信息获取的能力[21]。而地理研究的重要任务之一是探求一般性的普适规律，这使得针对特定区域研究得到的结论面临着“该结论在多大程度上能够应用到其他区域”的可复现性问题。该问题与人工智能技术中的可泛化性、可解释性密切相关。因此，实现地理空间人工智能，需要充分认识地理规律及其可复现性问题。

3.1 机器学习

机器学习是实现人工智能的核心技术之一，近年在人工智能领域取得的众多突破主要源于以深度神经网络为代表的机器学习方法的进步。机器学习是指利用特定算法，针对特定任务，基于训练数据和预定义的性能指标，不断提升完成该任务能力的计算机程序。机器学习可以解决的问题很多，但是最基本的两个应用是分类和回归，这两类问题在地理学研究中十分常见。分类和回归分析的主要目的是发现数据中的模式和规律，并识别驱动因素(可理解性)，进而支持相应的预测分析(预测性)。一个典型的地理学应用就是房价回归分析，即在房价和一组变量(如面积、户型、区位等)之间建立数学关联关系，从而发现解释房价的关键因子，同时预测在特定解释变量组合下的房价。

在机器学习训练过程中，泛化和过拟合是需要关注的基础问题之一。一个过拟合的模型对于训练数据具有很好的拟合优度，但是不具备良好的泛化能力，即不能很好地处理特征空间中训练样本之外的情形，如图2所示。通常，一个过拟合的模型需要更多的参数。根据“奥卡姆剃刀原则”，我们倾向选择参数更少、能达到较高拟合优度的模型。在实际应用中，过拟合标准并不易确定。如果目的仅限于对训练样本对应特征空间内的情形进行预测，则一个适度过拟合的模型是可以接受的；但是，若要追求一个较大范围内适用的模型，就必须避免过拟合的出现。

图2 机器学习中的欠拟合和过拟合

用机器学习思想重访地理研究中的规律发现和可复现性可以发现，一个针对特定区域的研究就是建立该区域的机器学习模型，从而解释、预测感兴趣地理空间变量(如房价、PM2.5浓度)的时空格局。但如前所述，地理研究的一个重要使命是探求更一般的普适性规律，这使得针对特定区域研究得到的结论面临着“该结论在多大程度上能够泛化到其他区域”的问题。从更大的空间范围而言，考虑到地理异质性的存在，针对一个区域构建的模型更倾向是“过拟合”的。因此，根据第2节的论述，当需要将基于特定区域观测数据得到的模型扩展到其他区域时，需要对模型进行松弛，如减少参数的数量，从而提升泛化能力。

3.2 地理空间分析中的知识泛化

假设我们基于一定的观测数据归纳得到了一条局部适用的地理知识，一个自然的问题是，我们的发现是否可以迁移到其他位置，即这条知识在多大程度上是空间可泛化的。解答这一问题需要更大范围的观测数据。假定整个研究区(如全国)的观测数据完备，可以从一条局部知识(如适用于某个城市的知识)出发，尝试将其扩展到邻近位置，直至知识不再适用，由此可以确定知识的空间泛化边界。图3给出了一个地理知识泛化的简单示例。给定一个变量a的空间分布，对于较小的区域S1，规律L1用一条精度较高的谓词(取值区间为[4，6])表达该区域变量的分布特征。若研究区逐步扩大到S2、S3，则规律L1不再适用，需要对谓词进行松弛，即扩大取值区间的范围，依次得到规律L2、L3。

图3 地理知识的空间泛化示例

以两个空间变量回归应用为例，已知研究区内各面状单元自变量X和因变量Y的取值，首先选取若干空间单元构成的空间连续区域A，利用A中各单元的数据拟合得到回归模型Y=f(X)；然后选取一个与A相邻的空间单元c，考虑将其加入A，此时模型的参数可能需要调整，以达到最优拟合(即知识的更新)，但只要模型对A中每个单元的拟合误差仍小于给定阈值，我们就认为模型可以泛化到c。这一过程重复进行，直到模型不再能泛化到相邻单元为止。上述讨论给出了确定一条地理知识空间泛化边界的一种途径。对于泛化边界之外的某一空间单元，我们认为这条知识并不适用；以该单元为出发点，重复上述流程，可以得到适用于另一区域的一条新知识；并最终得到研究区的一个区域划分，每个区域对应适用于该区域的一条知识，如图4所示。事实上，各区域的知识泛化过程可以借助区域划分[22]的空间优化框架同时实现，我们把得到的若干条谓词及对应的区域称为知识集。仍以前述两个变量的空间回归为例，区域划分的优化目标可以是“在每个区域的最大残差不超过阈值ε的条件下，使分区数目尽可能少”，这一优化目标在保证知识归纳准确性的同时，通过最小化知识的条数，实现了知识集的概括性。更一般的，可以将知识集的精确性(最小化归纳误差)和概括性(最小化分区数目)同时作为优化目标，此时我们关注的是所有满足帕累托最优性的解，它们体现了精确性与概括性不同程度的折中[23]。

图4 知识泛化过程的区域划分视角

在知识泛化的过程中，不仅其中的参数可以更新，知识的形式(模型的假设空间)也可以进行调整，如多项式模型变为线性模型、定量关系变为定性描述等。如前所述，复杂度较高的模型往往具有更大的过拟合风险，因而有必要在泛化过程中对知识进行松弛。在前述区域划分的优化目标中，知识集的概括性可以加入知识形式复杂度的度量，由此可以在牺牲精确性的条件下提升概括性，知识归纳的结果将因此具有更强的可泛化性。

3.3 地理空间人工智能的4个假设

地理学异质性、规律及可复现性存在着基本的矛盾。例如，许多机器学习方法依赖样本独立同分布假设，而空间异质性使得独立同分布假设不再成立。这些基本的矛盾决定了我们需要重新思考地理空间人工智能的一般假设和基础理论[24]。从人工智能提出的初衷而言，模仿人类智能一直是一个阶段性的目标，即开发“像人那样思考”的计算机程序。现代深度学习模型由于其强大的通用逼近能力(万亿参数)，通过拟合前所未有的海量数据(PB级训练数据)，已经在计算机视觉、自然语言处理、围棋等一些封闭任务表现出超越人类的性能[25-26]。例如，由OpenAI设计的GPT v3模型表明，计算机可以在超大语料库上完全利用语言自身的信号而无须任何人工标注，训练一个具有1750亿参数的语言通用模型，并且在无关任务上(如答题、翻译、写文章、数学计算等)表现出强劲的能力[27]。

然而，在人类思考智能的独特能力——归纳、类比和泛化能力上，人类依然占据无与伦比的优势。虽然人工智能实现过程也设计了相关的机制(如迁移学习)，以模拟实现人类智能的泛化能力，但依然与后者具有较大差距，因为人类具有天然的泛化能力，并且很容易确定泛化边界。因此，实现学习过程中对于规律的归纳、类比和泛化，依然是人工智能面临的巨大挑战。

综上所述，从4个基本问题入手，即泛化能力何以可能，模型通用性和专业性的何以平衡，什么学习才是有效的，动态和开放环境下的学习原则如何，构建地理空间人工智能应该实现4个基本假设：组合泛化假设、知识归纳偏置假设、学习假设、记忆和进化假设。

3.3.1 组合泛化假设

人类智力表现出强大的组合泛化能力[28]，即通过组合已知的基本元素理解和产生新的、近乎无穷的组合。对于地理规律和泛化性而言，一个根本性质就是需要从可以观察到的数据中获得基本原子语义；通过原子语义的重新组合，将观察转化为泛化规律。因此，地理空间人工智能也必须具备“组合泛化”能力，从而获得强大的数据解释能力，且能够对不同时空尺度的任务保持足够的泛化能力。

3.3.2 知识归纳偏置假设

地理学研究既有对于普适规律的追求，也有区域研究的传统。普适规律的追求要求我们得到的规律能够尽量通用，即在不同的时空范围都有效。这也是物理学的基本假设——时空不变性，也即物理定律不会随着时间和空间的改变而改变；区域传统则是追随异质性假设，认为不同的区域得到的地理学定律不尽相同。两者是一个统一的矛盾体，可以通过知识归纳偏置假设进行描述和统一[29]。知识归纳偏置中的归纳指的是从有偏采样中寻找共性、泛化，形成一个较通用的规律的过程，然后通过引入偏置对观测数据的理解、先验或规则进行建模。这些理解、先验或规则形成了对模型的约束，进而起到模型选择的作用，帮助我们从候选假设中选择更符合观察数据的模型。

对于地理空间人工智能而言，普适规律性是对于地理学基本定律更宏观、更一般的认识；而区域传统则可以看成是引入知识归纳偏置的过程，帮助我们通过先验或假设解决具体的问题。从这个角度而言，奥卡姆剃刀原则就可以看成是一种归纳偏置，即在所有可选假设中，选择最少假设的那个。不要奢望能找到一种算法对所有问题都适用，也可以解释普适性、泛化性与特殊性、区域性的内在辩证逻辑关系。

3.3.3 学习假设

3.3.4 进化假设

由于观测手段等限制，本质上很难获得研究对象的全体观测。而地理观测数据时空异质性的存在，使采样偏差变得更加显著。地理观测数据源自开放世界，数据和规律的演化在持续发生，因此地理空间人工智能必须能够以一种依赖于时间和空间的方式演化[30]，通过增量式的、持续式的、终身式的学习范式解决越来越复杂的任务。因此，记忆并以记忆为基础进化是地理空间人工智能能够持续发展并形成终身学习能力的关键。

4 地理信息科学的任务

当前，地理信息科学迫切需要与脑科学、人工智能等领域跨学科交叉与深度融合，从地理大数据自动抽取通用特征和知识，构建驱动地理科学知识发现的地理空间人工智能框架，推动地理信息科学走向智能化。具体包括以下4个方面。

(1)在机制上，地理空间人工智能对知识的学习、记忆、迁移及泛化能力的需求使得探究地理空间认知机制成为未来地理信息科学研究面临的挑战之一。人脑具有面向多尺度、多模式、多任务地理空间的认知能力。揭示人脑地理空间认知和类脑空间决策过程能够为发展智能化地理信息科学提供重要的理论参考，也是构建具有高度通用性的地理空间人工智能的关键途径。因此，需要系统地分析实验场景、任务、材料及人群的设置条件，在严格控制实验变量的前提下，开展地理空间综合认知实验，揭示人脑地理空间认知神经机制。

(2)在模型上，构建空间异质性、空间依赖性、空间交互性、空间聚集性等空间效应的通用智能模型，推动地理空间智能从理论走向实践。在这一方面，需要突破传统的经验驱动的地理规律建模方式，利用多通道人类生理物理数据与地理空间时空大数据，以数据驱动为主要研究手段，针对不同环境、不同尺度和不同对象的地理空间时空演化规律的数学本质进行挖掘与建模。

(3)在方法上，地理空间人工智能方法体系是发展智能驱动的地理科学知识发现的第五范式的重要技术前提和挑战。地理空间人工智能是建立在地理空间时空规律基础上的智能计算模型，传统的人工智能模型已无法满足基于地理空间认知的类脑智能决策需求。因此，需要基于人脑的空间认知机制，揭示人脑信息加工与知识提取框架，解构人脑知识关联与映射图谱结构，结合地理空间规律模型，开辟以自学习、记忆与进化、可解释、因果推理为基石的地理空间人工智能方法体系。

(4)在应用上，未来地理空间人工智能的应用将致力于突破人地耦合复杂巨系统理解、模拟、优化等瓶颈，助力解决全球气候变化、环境污染、经济发展等人类社会面临的大挑战[31]。基于地理空间人工智能模型，如何面向多尺度、多层级、多因素的复杂地理过程进行适配也是重要挑战之一。为此，需要从认知机制发现、规律建模、方法修正3个层次进行研究，对地理过程的模拟进行模块化，发现并建立模块间的耦合机理，从而开发面向不同地理问题的地理空间人工智能算法。