APP下载

全息地理重构理论、方法及应用探讨

2019-01-20刘朋飞崔铁军

关键词:全息本体重构

刘朋飞,崔铁军

(1.天津师范大学地理与环境科学学院,天津300387;2.天津师范大学天津市地理空间信息技术工程中心,天津300387)

随着计算机科学和信息技术的发展,人们开始利用信息技术模拟人的某些思维过程和智能行为,逐渐发展成为人工智能科学,其目的是模拟、扩展和延伸人类的智能.地理信息科学的研究目的是利用信息技术提升解决地理问题的能力[1].随着遥感技术和卫星定位技术的发展,人们感知地球表面物体和现象的手段逐渐多样化和智能化,地理信息感知能力大大增强,因此,在地理信息感知和地理信息应用领域,地理空间数据量呈爆炸式增长.GIS 发展的终极目标,是在大数据、云计算和人工智能的基础上构建智能GIS.智能GIS 可以模拟人的地理思维方式,利用所构建的地理数学模型,从多源地理数据中发现其中隐含的地理知识和空间联系,从而模拟、推演和预测地理发展规律,为人类决策提供科学依据.这里需要解决2 个问题:①探究事物的本原、本质或存在与事物的表征信息以及表达信息的数据之间的关系;②如何从事物的信息表征(数据)中认识事物的本质(规律).本文以本体论为基础,探讨地理本体和地理信息本体的内涵,以及产生多源地理数据的根源,基于全息论建立地理过程重构的理论体系[2-3],探讨多源地理数据的集成、融合、关联、推理、模型构建和同化等方法,以为构建智能GIS 提供理论方法,推动GIS 实现更高层次的应用.

1 全息地理重构理论

人类从感知得到的信息中通过大脑思考提炼出所需要信息的过程称为信息重构.它是人类在信息感知的基础上,对感知材料进行分析和综合,通过概念、判断、推理的形式,认知客观事物的本质属性和运动规律.

1.1 地理本体的多重数据表达

本体论(Ontology)是探究世界的本原或基质的哲学理论[4],它是研究存在的本质的哲学问题.通过直观认识到的事物,是实体物及实体物的活动,而通过视觉信息手段认识的事物,是图像化的世界.相对于整体世界,人类可见的事物是少量的,大量的事物是不可见的.利用可见事物的关联,探究不可见事物存在的机理,就构成了信息学本体论研究的内容,进而出现了信息本体这个概念[5].关于信息本体的定义,学术界一直没有统一的定论,但存在基本的共识,即信息本体包括概念化、形式化、可共享、明确、描述领域知识这5 大特征.这5 大特征基本涵盖了信息本体的实质内容.

哲学本体指一切实在的最终本性,是对客观世界的实实在在存在所做的客观描述,最终本性是唯一的,哲学本体不存二义性.这种哲学本性需要通过认识而得到,而对客观世界认识的结果是信息本体.信息本体的描述受客观和主观2 个方面的因素影响.客观因素是客观世界自身的复杂性和模糊性,主观因素是人类对客观世界认识和表达能力的局限性.人们对客观世界的认识存在重大差异,不同的科学领域对于相同的客观世界关注的重点往往是不一样的,因此基于不同学科背景所构建的信息本体必然会有差异,对信息本体的描述存在多样性.

地理数据是地理信息本体最主要的表达形式和载体.人们运用各种信息手段获取客观世界的地理数据,构建了现实世界的抽象化的各种数字模型.这种数字模型近似地记录了某个瞬间的地理现象.根据本体论思想,地理本体表达为多种多样的地理信息本体[5].同一地理客体因为地理信息本体的抽象程度和应用目的的不同,在地理空间数据中存在着不同的几何、拓扑表达及属性描述的多重表达(Multiple Representations)现象,具体表现为现实世界的对象在地理数据表达中的几何多样性、语义多样性以及相关对象或属性之间的各种层次的对应关系.不同种类的多源地理数据可能具有不同的特征,而这些特征也是多样化的,可能是相互支持或互补的,确定的或模糊的,还有可能是冲突矛盾的.

如何有效地整合多源异构地理数据,将它在时空上的互补和冗余按照某种组合规则进行优化处理,在进行多方位、多层次的数据处理后获得对地理目标的理解、认知以及更多有价值的信息,并且获得比它的各个部分所构成的系统质量更高的性能,达到提高信息综合利用率和系统有效性的目的,成为GIS 智能化的关键问题之一.

1.2 多源地理数据的全息地理重构

根据全息地理理论,宇宙中的任何事物或组成部分都是按全息构成的,部分是整体的缩影,全息重构的实现是从全息地理元认识整体地理本体的思维过程[3].全息地理元的载体是多源地理空间数据,但是地理空间数据只能记录地理物体的瞬间现象,不能完整地记录地理过程的全部信息,而且,由于外因干扰,有些地理全息特征可能发生形变.为了克服全息不全的实际情况,在地理大数据的研究和应用过程中,人们不再探求数据的因果关系,转而关注数据的相关性,采用多源数据关联和融合分析方法,从多源数据关联中发现和理解地理内容及地理实体之间的关系,这即是全息地理重构.全息地理重构的过程实际上是一个基于多源数据关联的求解地理问题的过程: 从空间角度,通过地理全息元的几何位置、形态、大小、方位、维度和相互关系的空间结构揭示地理要素的空间布局;从时间序列角度,针对空间分布环境中的不同地理事件间的时序关系进行演化推理;为了发现地理时空演变规律,将时间和空间纳入统一基准之中,建立各种全息地理元的相关性关系,在此基础上推演地理时序发展过程.

由此可见,地理本体是客观存在,而地理信息本体是人们对地理本体的认知,地理数据是地理信息本体的全息地理元表达,是地理信息本体的逼近表现形式[5].全息地理重构是利用计算机和信息技术对人脑综合处理复杂地理问题过程的一种功能模拟,它依据多源地理感知数据,通过对多源地理数据的整合分析、关联和融合处理认知地理本体,辅助人们认知地理发展规律.

2 全息地理重构方法

利用计算机模拟进行全息地理重构由3 部分组成: ①利用信息技术探测到的地理数据表示地理现象,形成全方位、多层次和时序连续的感知多源地理信息(全息地理元);②模拟人类的地理思维过程,构建地理模型,用计算机代替人的大脑处理信息必须将自然规律转变为数学模型或算法,并力求通过计算机模拟等方式发现人类获取和利用知识的规律,最终实现人工智能;③应用计算机的数字计算方法,基于地理模型,将感知的多源海量地理数据进行集成、聚合、融合、关联、推理和同化,形成一个有机的整体信息(知识).

2.1 数据集成与融合

数据集成(Data Integration)是使多源异构的地理数据在逻辑上或物理上构成一个有机整体的过程[6].由于不同的地理数据可能来自不同的途径,其内容、格式和质量千差万别,有时甚至会遇到数据格式不能转换或转换格式后信息丢失等棘手问题,因此,数据集成应充分考虑数据的属性、时间和空间特征、数据自身及其表达的地理特征和时序过程的准确性,通过某种方式改变原有的数据格式或表达方式,以实现地物实体的空间基准、数据模型、语义编码、属性分类分级和数据格式的统一[7-8].

数据融合(Data Fusion)是将多源数据有效地结合起来,根据某种特定的应用目的,将同一地区不同来源、不同时间、空间上不完整的观测信息整合到一个地球表面系统的一致性表达中,重新组合语义数据,最终使新的数据能够准确地表达客观实体,以改善地理空间实体的几何精度,获取高质量地理信息[9].

多源地理数据的集成和融合是数据整合的2 个阶段.数据集成是初级阶段,是数据融合的基础;数据融合是高级阶段,是在数据集成基础上的进一步发展[3].二者的差异在于:数据集成后,数据并没有发生质的变化,仍保留着原有的基本特征;而数据融合后产生了新的数据,提高了数据的质量[10].

2.2 空间关联与推理

空间关联(Spatial Association)是指基于2 种或2种以上的,分布在统一时空基准上相应尺度的地理数据,探索和挖掘这些数据间的相关性和依赖度,将相互影响、相互制约、相互依存的地理要素构成一个有机整体.当代地球科学的宏观发展趋势更强调“系统论”思维,也就是强调地球表面各组成要素和各组成部分之间的内在联系,认为它们是相互联系相互制约的,并能结合成为一个整体[11].地理系统各要素之间以及系统与环境之间发生着广泛的物质、能量和信息交换,这是地理空间现象和空间过程的本质特征,也是现实世界存在秩序和格局的根本原因之一.

多源地理数据中必然隐含着地理现象关联的知识,但目前的地理空间数据模型只能表达简单的、显式的地理现象之间的联系,对于地理空间位置及动态时空过程中隐含的关联性关系的表达具有局限性,这成为地理数据挖掘和地理信息服务的主要瓶颈.多源地理数据空间关联,旨在克服人类在地理信息感知、认知和表达等方面的局限性,利用计算机算法挖掘地理要素之间的内在联系,从凌乱的地理数据中构建机构化的信息(地理知识),从而发挥多源地理数据的综合优势[12].

空间推理(Spatial Reasoning)是指利用地理数据中的显式或隐式的属性、拓扑性质和几何信息,并结合相关的空间约束来获取所需的未知地理信息[13-14].空间推理涉及空间目标的特性以及推理所采用的算法或演绎方法,其中空间目标的特性包括拓扑性质、形状、大小、方向、距离等.空间推理是利用空间目标的位置、形状和方位等信息以及目标之间的空间关系解决空间问题的有效方法,每种空间推理方法必须给定其特定的空间概念集及相应的推理规则.空间事实是有关诸如存在物、描述特征和位置地点的事实,空间关系式是指空间中地点之间的关系,如相交、连通等[14].

地理空间推理是人类认知世界的一项基本活动.在地理世界中我们用视觉来感知图像,基于地理空间认知原则,识别各种要素及相互关系,并根据这些事实和知识进行空间分析与规划[13].在计算机世界中,计算机依据地理空间目标的位置、形状和方位距离等信息以及目标之间的空间关系,利用精确的规则制定操作的指令和精确的数学关系进行逻辑判断.

地理数据关联是地理空间推理的基础,地理空间推理是地理信息重构的核心,它贯穿于地理信息数据表达、地理数据组织、地理空间分析与决策等全过程.

2.3 地理建模与同化

地理建模(Geographic Modeling)是指人们为了某种特定目的而对地理问题所做的一种简化模型[15].地理系统中丰富的内容、复杂的结构和功能的多样性,给人们分析、研究地理系统带来了挑战.地理事物或现象是一个多因素综合体,地理因素之间存在着相互依赖又相互制约的关系,这种关系通常是复杂的非线性关系.为了分析地理要素之间的相互作用机制,揭示其内部规律,可以根据地理理论的推导,建立反映实际问题的数量关系,然后利用数学理论和方法去分析和解决问题[16].最常用的地理建模方法,是在地理观测数据的基础上,应用数理统计方法,从复杂的要素中选取影响因子,对影响因子进行量化,建立指标体系和数据模型,依据实践经验,采用定量与定性相结合的方法,设计一种地理模型来代表所研究的地理对象[17].

构建地理模型必然涉及空间和时间2 个变量,每一个地理对象的时间和空间变量都是连续的,而且是复杂的,因此,对一个地理现象采用一个函数f(x,y,z,t)(x、y、z 表示空间坐标,t 表示时间)进行描述和数学建模在大多数情况下是无法实现的.对地理系统模型进行简化的一个方法就是空间离散化(格网化),其核心是按照一定的规则将有机整合在一起的现象划分为若干个单元,每一个单元的属性相对一致,区域间的联系表现为单元间的相互作用,每个单元都有一定的属性和运动规律,不同属性的单元之间有一定的作用规则,这样地理现象的发生机制就可以某种模型表达出来,这使得地理系统易于利用计算机来构建模型进行模拟.

全息地理重构就是利用数理模型、计算机技术等手段对复杂的地理过程进行定量化研究,在可感知的和可测量的基础上,按照不同的时间尺度,即时段的长短,依照时序感知各类地理性质的表现(地理数据),而后将这些数据放在某个规定的模型中进行分析,从而得到地理现象在纵向上的变化规律.

数据同化(Data Assimilation)的核心思想是在地理过程的模拟和预测过程中,融合不同来源、不同精度、不同时空分辨率的直接或间接的观测数据,利用这些观测数据不断调整地理过程的模型参数,依据严格的数学理论,在模型数值与实际观测值之间找到一个最优解[18],这个最优解可以继续为地理系统模型提供初始值,依此不断循环下去,使得模型的结果不断地靠近观测值.但是,随着时间推移,地理系统模型的预测值与真实值的误差会越来越大,这是由模型的不确定性较大造成的,模型的物理结构、参数、驱动机制和初始条件的不确定性都可能通过复杂的误差传递反映到模拟结构中.这种不确定性往往是由地理过程发展的未知性和时空异质性所带来的不确定性所造成的.异质性和不确定性是地理系统的固有特征,它们能够被估计和控制,但却不可能完全消除.为提高模型预测的准确性,通常情况下可以通过数据同化算法,不断融合时空上离散分布的不同来源和不同分辨率的直接或间接的观测信息来自动调整模型参数,以改善其预测精度,提高预测能力.遥感的观测手段具有宏观、定量和连续性的特点,无论是反演(如土壤水分),还是依靠模型间接估计(如蒸散发),都能得到地球表面观测时刻的“真值”.在研究区域尺度上地理时空变化特征的主要变量时,如果能够将对地观测得到的数据同化到地理模型中,就有可能显著地提高地理模型的模拟和预测(特别是短期预测)的精度,并同时度量模型的误差[19].

3 全息地理重构应用案例

自然灾害是指给人类生存带来危害或损害人类生活环境的自然现象.研究自然灾害发生及其影响的时空动态变化和空间分布是地理信息科学最重要的任务之一,包括潜在灾害的预测定位、灾害发生时影响范围的界定、灾后的灾难性损失的计算、应对措施的制定等.下面以潜在的洪水、滑坡和森林火灾等自然灾害预测为例,给出全息地理重构在科学决策中的应用.

3.1 洪水灾害预测

洪水灾害是降雨量超过江河、湖泊、水库等容水场所的承纳能力,造成水量剧增或水位急涨的水文现象[20].洪水灾害与降雨量、植被覆盖、土壤类型、地形地势、大小河流水位、水库水位、大型湖泊水位等因素有关.相关流域的自然地理信息包括面积、坡度、土壤植被、地形地貌、数字高程(DEM)等.洪水灾害同气候变化一样,有其自身的变化规律,这种变化具有或长或短的周期性,因此洪水灾害通常循环往复发生.利用远程水位监测数据、地面气象数据、气象卫星数据、GIS 植被覆盖数据和地形数据,可以构建洪水灾情模型,预测洪水灾害等级(溃决型、漫溢型、内涝型),从而提早防范、及早发现险情,以有效减少人员伤亡和财产损失[21].

3.2 森林火灾预测

森林火灾预警需要综合考虑天气条件的变化,可燃物干湿程度变化和森林可燃物类型等因素,从而采用数理模型预测火灾发生的可能性[22].森林火灾的发生绝不是偶然的.从气候角度考察,森林火灾的相关因素都有一个孕育的过程,即只有当环境温度、相对湿度、降水量达到一定阈值时,才可能引发林火.气象条件是决定森林火灾是否发生的重要因素,其中气温、相对湿度、风速和降水因子最为关键.降水量与森林火灾呈负相关,当月降水日数较多时,对应该月的森林火灾次数就会下降,最长连续无降水日数与森林火灾次数呈正相关,连续无降水日数越长,相对湿度越小,蒸发量越大,林内地被植物就越干燥,发生森林火灾的概率也就越大.风速可作为间接因子来考虑对可燃物含水率的影响,在林火行为预报中通常将风速作为决定林火强度、林火蔓延速度、火场面积的直接因子.这些影响因子结合在一起,可以有效预测火险等级[23].

3.3 地质滑坡预测

地质滑坡是一种常见的地质灾害现象,模拟和推演滑坡体的演变过程,及时预测滑坡灾害的特征信息,可为地质滑坡预测预报及治理提供科学依据[24].影响地质滑坡的因素包括内在因素和外在因素2 个方面[25].内因主要包括区域内的地质构造、岩体结构、组成边坡岩土体的性质、地应力、地形地貌以及水文地质条件等.外因主要包括地表水和地下水的作用、地震、风化作用、人工开挖、爆破以及工程荷载等.地质滑坡过程存在多种不确定性的灾变因素,是一个典型的“黑箱”问题,利用已有的地质理论来解决这一“黑箱”问题,几乎是不可能的.构建地质滑坡预测模型,可以根据灰色系统理论,将多元空间信息统计分析与非线性统计预测相结合,统计各个滑坡影响因子之间的统计相关性和位置相关性,研究地质滑坡与影响因子之间的定量关系,逐步筛选综合系数求得最佳预测因子集,并通过已知滑坡样本集与预测样本集,构建地质滑坡多因子定量预测模型,对滑坡的危险性进行预测.

4 结论

全息地理重构是构建未来智能GIS 的基础理论,它以地理信息本体和全息地理理论为基础,以现代地理感知技术所采集的多源地理空间数据为依托,通过多源多时空地理数据的集成和融合,利用地理空间数据分析、关联和推理以及时空大数据挖掘等方法,以地理过程建模为核心,重构地理对象时空变化过程,通过数据同化算法不断融合时空离散分布的不同来源和不同分辨率的直接或间接的观测数据来自动调整模型轨迹,以改善动态过程模型状态的估计精度,提高模型预测能力.本文以本体论为基础,基于全息论建立地理过程重构的理论体系,探讨多源地理数据的集成、融合、关联、推理、模型构建和同化等方法,为智能GIS 的构建及推动GIS 更高层次的应用提供理论方法.

猜你喜欢

全息本体重构
全息? 全息投影? 傻傻分不清楚
视频压缩感知采样率自适应的帧间片匹配重构
长城叙事的重构
"全息投影"
眼睛是“本体”
高盐肥胖心肌重构防治有新策略
全息欣赏:小学美术“欣赏·评述”学习新样态
一种基于社会选择的本体聚类与合并机制
北京的重构与再造
全息影像造就“立体新闻”——全息影像技术在传媒领域中的应用