APP下载

顾及空间相关特征的最大熵DEM插值权系数计算

2020-12-04陈天伟康传利段青达韦海福

桂林理工大学学报 2020年3期
关键词:参考点约束条件插值

陈天伟,康传利,陈 明,段青达,韦海福

(桂林理工大学 广西空间信息与测绘重点实验室,广西 桂林 541006)

0 引 言

格网DEM作为国家基础地理信息基础, 得到了广泛的应用, 具有极其重要的意义。 然而其精度仍有进一步提高的需求, 特别是在数字地形分析领域。 一般, 规则格网 DEM由数学插值方法得到。 插值方法有多种, 包括多项式插值、 多面函数插值、 地统计插值、 加权平均插值等算法[1]。 由插值核函数解算插值权系数, 以求得待插点高程值, 其高程误差来源于原始数据误差和模型逼近误差两方面, 插值模型与实际地表符合的程度决定了逼近误差的大小。 如地学界一般认为, 地统计学插值方法是在最优线性无偏估计的准则下, 对未知点空间属性及插值精度进行估计[2-3], 在平稳假设的前提下, 理论上可以得到很高的插值精度; 然而, 地形表面的变化时常不符合平稳假设, 此时构建的插值模型与实际不符就会显著降低插值精度。 如由地统计学的杨赤中插值法求解参考点的权系数时, 可能会出现负权系数, 导致估值结果的不合理, 引起DEM建模的失真甚至错误。 有国内学者对此类负权现象展开研究, 认为出现负值与参考点、 待估点的点位关系以及插值函数模型等因素相关[4]。 而笔者则认为更主要的是由于传统插值方法在构建数学模型时存在主观因素的干扰。 由于空间抽样数据(如高程值)存在随机性, 依据最大熵原理[5], 要使数学模型对样本试验数据依赖程度最大, 那么熵值应该最大, 使得插值模型更能反映空间数据的离散性, 则模型会最稳健, 解算模型则可以避免负权系数的产生,笔者在文献[6-7]中验证了上述观点的正确性。 另外, 注意到地形离散点之间客观存在着空间相关性, 在建模时顾及空间数据的相关特征, 应可以使DEM模型更加符合客观实际。

1 模型建立

1.1 最大熵模型的基本形式

最大熵方法是以空间域随机变量的信息熵最大为准则, 其数学模型包括目标函数和约束条件。 目标函数即熵值最大, 约束条件包括样本点(参考点)高程值的数学期望和方差等, 故建立最大熵模型[6-7]。

模型系统的熵值

S[p]=-(p1lnp1+p2lnp2+…+pnlnpn)/ln 2,

(1)

约束条件

(2)

其中:pi为空间域变量的产生概率(即权系数);pi>0;i=1,2,…,n;S[p]为系统熵值。 约束条件第1式即0阶矩约束(或称自然矩约束); 第2式即1阶矩约束: E1=E(h)是高程变量原点矩的期望值(随机变量hi的原点矩等于相应的样本矩)[8], 则E(h)可利用参考点与估值点距离反比例赋权, 对参与估值计算的参考点权系数取加权平均值算出; 第3式即2阶矩约束, E2是高程变量2阶中心矩的期望值, 利用高程样本值和E1按计算方差估值的公式算出。

1.2 空间变量相关特征的表达

上述约束条件的本质是通过期望值和方差反映研究区域高程值变量的分布中心以及离散度。根据地理学第一定律, 地貌在一定空间范围内具有相关性, 应在约束条件中表达出这些特征。

在地统计学理论中,认为高程属于区域化变量,满足2阶平稳假设情况下,在一定的范围内,点和点之间是相关的[9],相关程度与距离成反比。克里金法采用了半变异函数等指标描述此相关特征,杨赤中法采用了综合随机特征函数进行描述[10]。常用的反距离加权插值法亦是基于地理学第一定律的原理,即在一定区域,距离越近事物越相似。那么在解算DEM插值模型得到的各参考点权系数的大小,其实也就表达了插值点(待估点)与其邻域的参考点(已知点)的相关程度,即权系数大小与参考点、估值点间距平方成反比。为了简化最大熵模型的复杂度,在设置约束条件中仅仅增设最大最小权约束条件,即距离插值点最近的参考点权系数最大;反之,距离插值点最远的参考点权系数最小。

如图1所示, 某待估点(最中心的点)对应的参考点有5个,其中1#点距离待估点最远,3#点最近,根据空间数据自相关的特性,1#点权系数应该最小,3#点权系数应该最大。

图1 参考点、插值点的点位分布Fig.1 Distribution of reference points and interpolation point

相应的空间相关约束条件: ①最小权约束条件p1-p2<0,p1-p3<0,p1-p4<0,p1-p5<0; ②最大权约束条件p2-p3<0,p4-p3<0,p5-p3<0。 转换为矩阵表达式

(3)

(4)

此处,2#参考点在杨赤中法计算结果为负数,这是因为该点到待估点的方向被3#点屏蔽的缘故。2#、4#、5#参考点与待估点的距离介于最大、最小之间,本文不作类似的空间相关性约束,以免增加问题的复杂程度从而影响模型解算的效率。它们的权系数由以上模型自然解得。可见,上述有关空间相关性的约束表达式相当于给最大熵模型提供了最重要的空间相关特征信息,并进一步缩小了可行解范围,有利于加快模型解算收敛速度,求得最优解。

待估点x0的估计量

(5)

2 模型解算

上述模型的解算本质上属于非线性函数约束优化问题,即寻求全局最优解的问题。所谓全局最优解是指每一次解算某个未知点高程时,先要解算搜索到的参考点的权系数,这些权系数的解有很多组,要找到满足约束条件且对应熵值为最大的权系数解,进而推算未知点高程。

由于目标函数是复杂的非凸函数,只能用数值计算方法进行优化。传统的优化算法往往求得的是局部最优解,而不是全局最优解,在此利用遗传算法进行解算,再结合最大最小权约束条件,能尽快锁定全局最优解。遗传算法(GA)模仿遗传学自然选择进化过程,主要是通过基因的组合交叉和变异逐步进行问题的优化,避免陷入局部最优解,从而寻找到全局最优解。该算法对于大空间、全局范围内求解最优解具有较强的优势。其基本操作包括编码、选择初始种群、设置适应度函数、遗传算子操作(选择、交叉和变异)、控制参数设定、循环终止设计[11]。GA自身通常解决无约束优化问题,而本文建立的最大熵模型包括3个线性等式约束和n个非负约束,n即参考点个数。实践中常用罚函数法,将有约束问题转化为无约束问题。通过惩罚不可行解,使其目标函数值增大(对求极小值问题),适应度值减小,经过不断迭代,种群逐渐收敛于可行解,同时迫使无约束问题的极小点逐渐收敛于约束问题的极小点。构造带有惩罚项的适应度函数一般有两种: 一种是采用加法形式val(x)=f(x)+p(x), 另一种是乘法形式val(x)=f(x)·p(x)。 其中p(x)是惩罚项。

商业数学软件MATLAB附带有遗传算法函数工具箱, MATLAB的GA主函数调用形式为[12][x, fval]=ga(ObjectiveFunction,nvars,A,b,Aeq,beq,LB,UB,ConstraintFunction,options),其输入参数包括:目标函数名、变量个数、线性不等式约束系数阵及常量、线性等式约束系数阵及常量、变量的上下界、非线性约束条件函数名、选项。

前述约束条件式(2)的前3项对应于线性等式约束Aeq和beq,pi>0非负约束对应于变量的上、 下界UB和LB, 而对于组成线性不等式约束系数阵A及常量b, 由空间相关约束条件式(3)、(4)得到。 一般地, 对于某个待估点, 设参考点有n个, 第i点距离待估点最远(权最小),第j点最近(权最大)。

组成线性不等式约束系数矩阵的方法是先列出最小权系数约束条件, 其不等式系数矩阵为: 在行列数均为n-1的负单位阵第i列之前插入元素为1的列向量, 即得线性不等式约束系数阵的第一部分A1, 即式(3)左边的系数矩阵;再列出最大权系数约束条件,其不等式系数矩阵为:在行列数均为n-2的单位阵第i列之前插入元素为0的列向量(若i大于n-2,则在最后列右边加入),再在新矩阵的第j列之前插入元素为-1的列向量(若j大于n-1,则在最后列右边加入),即得线性不等式约束系数阵的第2部分A2,即式(4)左边的系数矩阵;上下组合A1和A2即得A,常量b是2n-3个0元素组成的列向量,即式(3)、(4)右边的0元素列向量。

应注意, 若最大熵模型不存在非线性约束条件, 则在程序中指定非线性约束条件函数名为空值。

3 实例与分析

在某山地区域1∶1万地形图提取离散特征高程点60个[7],以选取某待估点作插值运算为例,按极限半径搜索该待估点四周的参考点,得到5个参考点。分别采用杨赤中法、二次规划法、最大熵法3种方法计算参考点权重系数进行对比,结果见表1。

表1 不同插值方法参考点权重系数对比Table 1 Comparison of reference points weight coefficients with different interpolation methods

根据杨赤中法,不考虑负权问题即直接解算方程组(1),解得λ2=-0.033 5,结果证明负权问题是存在的。

利用二次规划法解算权系数[13], 参照杨赤中方法算得的权系数, 将负权系数改为0.001, 设权系数初始值为[0.050 0.001 0.688 0.111 0.152], 计算结果见表1中的二次规划法。

在MATLAB平台利用遗传算法函数进行编程,对最大熵模型进行解算。基本步骤是:先利用式(2)作为目标函数, 编制适应度评价函数; 再编制主程序及确定初始值X0, 初始值即初始权系数, 其值选择恰当, 则能够加快优化计算的收敛速度。 根据参考点与估值点的距离反比例计算权系数, 赋权公式为pi=1/di, 其中di为参考点i到估值点的距离。 对pi归一化得到程序调用的初始权系数为0.023 9、 0.030 2、 0.403 6、 0.311 2、 0.231 1。 由此计算得矩约束条件的系数E1和E2。

在遗传算法的主程序里,首先指定调用的目标函数,再确定约束条件的各系数矩阵,设置参数及调用遗传算法函数的主要代码为:

ConstraintFunction=[];

% 没有非线性约束条件

options=gaoptimset(‘PlotFcns’,{@gaplotbestf,@gaplotmaxconstr}, ‘Display’,‘iter’);

options=gaoptimset(options,‘InitialPopulation’,X0);

[x,fval]=ga(ObjectiveFunction,nvars,A,b,Aeq,beq,LB,UB, ConstraintFunction,options)

运行程序,可解算得各pi值即权系数得到结果(表1),可见最大熵法能消除空间权重系数负值现象。

3.1 权值的对比

由表1数据可见,杨赤中法存在负权现象(图1)。二次规划方法虽然能消除负权现象,但是得到的权值分布不合理,离待估点最近的参考点权值接近0值,远离待估点的参考点权值却是最大的,此现象不符合空间数据相关的规律。负权值对应的2#参考点虽然离插值点并不是最远的,但被靠近插值点的3#参考点所屏蔽,最大熵法求得2#参考点的权值为非负,且大于最远的1#参考点的权值,这表明该法是符合空间变量相关特征的。

3.2 精度的对比

3.2.1 抽样统计高程插值中误差 对研究区域划分12.5 m×12.5 m格网, 利用杨赤中、 二次规划和最大熵3种方法分别进行格网点高程插值, 抽样统计格网点的高程插值中误差结果分别为±1.123 6、 ±2.168 6和±0.963 2 m。 可见, 最大熵法算得的估值精度最高, 满足国家有关DEM建模精度的规范要求[14]。

图2为上述区域采用杨赤中方法、顾及自相关特征最大熵方法生成的等高线,可见等高线回放效果有一些差异,后者反映出更多的局部地形特征细节。

图2 不同高程插值方法生成的等高线Fig.2 Contour generated by different elevation interpolation methods

3.2.2 各种插值方法构建DEM的高程比较 将最大熵法插值得到的网格点高程数据在ArcGIS软件构建DEM,并与克里金法、反距离加权法构建的DEM对照分析如图3所示。

图3 不同高程插值方法的DEM栅格图对比Fig.3 Comparison of DEM raster maps with different elevation interpolation methods

作栅格运算,将最大熵法DEM分别减去克里金法和反距离加权法的DEM,结果如图4所示(黑色、 灰色、 白色分别表示正最大、 最小、 负最大)。在图4a中,高程差值绝对值最大为2 m,在起伏较大区域,最大熵方法平滑效果比较明显, 即在山顶最大熵法高程值低于克里金法;在谷底最大熵法高程值高于克里金法;图4b中,高程差值最大为3 m,且没有太明显的规律,由误差理论分析得知该数值符合3.2.1节各种高程插值方法对中误差的描述。

图4 不同高程插值方法栅格相减结果Fig.4 Results of raster subtraction with different elevation interpolation methods

3.3 时间效率的对比

最大熵法、杨赤中法、二次规划法、克里金法、反距离加权法的插值时间效率分别为3.667、2.985、3.534、3.018、2.365 s。从计算效率来看,由于附加了空间相关性约束条件、缩小了可行解范围,相较于文献[7]不带空间相关性约束条件的最大熵法加快了模型解算收敛速度。由此可见,反距离加权法速度最快,而最大熵法运算效率最慢,主要原因是最大熵方法解算最优值时采用了智能算法GA,其使用随机搜索并进行了多次的迭代,这是其不足之处。

4 结束语

对于传统的DEM格网插值数学模型,由于其在拟合估值核函数时存在主观因素的干扰,模拟得出的数学模型存在不稳健、不合理的现象,以至于有时出现负权系数。本文采用最大熵为目标函数的建模方法,在约束中增设空间数据的相关性特征约束,最大程度地排除了主观因素,消除了空间权重系数负值现象,得到的权值大小比例分布与参考点位分布协调一致,插值精度更高。这说明该法不仅能客观反映出空间数据的离散性,也使得模型系统更加稳健。从而DEM插值精度有了较大的提高。不足之处是,顾及空间相关特征的最大熵法模型解算总的运算速度较慢,下一步研究将转向减少其迭代次数或者采用解析算法以提高效率与精度。

猜你喜欢

参考点约束条件插值
基于一种改进AZSVPWM的满调制度死区约束条件分析
FANUC数控系统机床一键回参考点的方法
基于Sinc插值与相关谱的纵横波速度比扫描方法
基于pade逼近的重心有理混合插值新方法
数控机床返回参考点故障维修
混合重叠网格插值方法的改进及应用
基于参考点预测的动态多目标优化算法
基于混合并行的Kriging插值算法研究
基于半约束条件下不透水面的遥感提取方法
基于参考点的图像可变目标快速检测方法研究