APP下载

一种地物点云数据栅格化分类新方法

2021-04-20解全波张海明孙国强

北京测绘 2021年2期
关键词:栅格聚类向量

解全波 刘 荣 张海明 孙国强

(1. 山东科技大学 测绘科学与工程学院, 山东 青岛 266590; 2. 山东科技大学 计算机科学与工程学院, 山东 青岛 266590; 3. 吉林大学 地球探测科学与技术学院, 吉林 长春 130026)

0 引言

激光扫描技术[1]在测绘、遥感等领域的快速发展,使得空间数据的获取已经由单点、稀疏的数据采集模式转变为连续性强、密集且自动的数据采集手段,用海量的点云数据来提供更为可靠的测量数据支持,这一变化提高了工作效率和数据采集的规模,同时使基于点云数据的地物分类[2]成为点云数据精细化处理[3]和应用方面的首要问题。

近年来,地物分类方法的研究主要集中在对所获点云数据的分析和提取上,主要的分类研究方法有:ELBERINK等[4]基于较为规则的地表模型高程影像,依据高程纹理的各项异性特征对地表上地物进行了分类;为了更好地区分城市建筑物和植被,通过对数学形态理论中的Top-Hat变换得到滤波LiDAR影像进行处理实现;杨耘等[5]先将影像按照面向对象的分割方法分成不同的研究对象,再利用地表模型和地表信息,基于支持向量机的分类方法完成对点云的分类。董保根[6]提出利用支持向量机分类器和面向对象的分类方法并提出一种“符合人类视觉”的分类精度评价标准。刘志青等[7]将信息向量机、相关向量机及支持向量机分类器应用到点云数据分类中,从而达到分类效果。释小松等[8]利用网格化聚类和重采样方法对原始点云进行压缩,然后提取多尺度邻域点云,最后利用改进PointNet完成对点云数据的分类。

本文将在此基础上,对点云数据栅格化[9]进行研究,利用典型地物分类方法和基于支持向量机的地物分类方法对栅格化后地物进行分类。通过对不同分类方法的比较,验证了地物点云数据栅格化分类的可行性。

1 地物点云数据栅格化原理

1.1 确定栅格属性

由于点云数据蕴含着丰富的几何和物理信息,所以确定点云数据的某一个属性值作为研究对象,来分析点云数据在不同地物上所呈现出的差异性,并可以基于此确定为栅格影像属性值。本文通过对所获取点云数据的二十余项属性值,包括全局坐标、RGB(红、绿、蓝三个颜色,Red、Green、Blue color mode)[10]、反射率[11]、温度等进行分析。研究发现,反射率和RGB值较其他属性值能够更好地反映出不同地物的差异。本文通过对不同地物、同种地物但颜色不同的两种情况进行反射率和RGB属性实验,随机离散点的两种指标属性变化趋势如图1(a)、(b)所示。

图1 两种指标变化趋势

从图1可以直观地看出:在不同地物区域反射率和颜色值都能反映地物的属性变化,反射率较颜色值对不同地物的反映更加敏感,区分得更加明显。对于颜色不同的相同地物,颜色值虽然也能反映不同颜色地物之间的差别,但反射率能够更加细微地反映出颜色差异。所以本文采用反射率值作为栅格化后栅格影像的属性指标。

1.2 数据栅格化

栅格数据又称为像元结构,是一种将地表均匀分为紧密相邻的网格阵列,将网格作为像素,用行列来定义同时具有属性信息或属性记录指针的数据结构。因此,栅格数据具有表示地物或现象的非几何属性的优势。将点要素转换为栅格数据后,就可以利用栅格数据的特征对栅格影像加以分类和分析。

为了能够更好地获得具有较强代表性的地物离散点,本文采用等间距法来获取标准间距离散点。将所选择的数据按照投影规则投影到某一个平面上,本文选择投影到xoy平面,保留数据平面坐标,即对数据平面化,然后将反射率值作为一项新的属性值。然后将新生成的点云数据即点要素利用ArcGIS转换为栅格数据,其中将反射率值作为栅格属性值。栅格化流程如图2所示。某花坛点云数据栅格化后效果如图3所示,其中地物类别为:水泥地面、灰色方砖、花卉。

图2 栅格化流程图

图3 栅格化后数据

2 栅格影像分类方法

遥感影像中根据影像像元的光谱特征差异或空间信息差异实现对地物的分类方法可主要分为监督分类[12]和非监督分类[13]。支持向量机分类[14]算法作为机器学习领域和模式识别领域的热门话题,因其有效的统计学习方法和小样本学习效率高、推广性好和抗噪能力强等特点成为遥感影像分析和处理研究方面的热点。

2.1 监督分类

监督分类是一种基于先验知识的分类方法,通常又被称为训练场地法。监督分类是通过建立辨别函数来对影像进行分类的,分辨函数建立的前提是依据所选取的训练样本特征确定适宜的分类特征参数,使得各类样本的区分程度尽可能高。监督分类的方法主要包括马氏距离法、最大似然法、最小距离法、平行六面体法等。

2.1.1马氏距离法

马氏距离法[15]认为所研究的不同类别地物其协方差都是相等的,同时该方法利用了距离分类器。距离分类器在每个类别统计信息的方向上非常灵敏。马氏距离法中的距离定义由于考虑了样本间的相关性影响,所以是一种广义的距离定义方法。由于方差和协方差已经计算得到,所以内部变化较大的类产生于内部变化较大的聚类组。马氏距离计算如式(1)所示:

(1)

11月16日,云南电网公司解除了金沙江白格堰塞湖泄洪自然灾害Ⅱ级响应,转入灾后重建阶段。自11月14日金沙江白格堰塞湖溃泄进入云南,两天来,一路气势汹汹,迪庆、丽江遭受重创,丽江更是遭遇了有水文记录以来的最大洪灾,沿江两岸数万名群众紧急转移安置。

马氏距离法分类的主要步骤可以分为:(1)确定研究区波段和特征分类数,检查波段和特征分量的位置配准情况;(2)根据实地情况选择训练区;(3)计算协方差矩阵和各类均值;(4)确定分类半径,进行分类;(5)将训练区外像元逐个带入计算公式,根据分类数确定计算次数;(6)比较马氏距离大小,以最大值为准分出类别,终得出分类结果图;(7)在监视器中给各类加上不同颜色;(8)结果检查,若分类错误较多则重新分类,直至结果满足要求。

2.1.2最大似然法

最大似然法[16]是一种非线性分类方法,建立在贝叶斯数学准则之上并假设影像的各波段类别统计都是正态分布,它是非线性分类方法中错误率最小的一种分类方法。该方法根据计算所得的各类别的似然度,判断像素对于哪类似然度最大,从而将该像元分到该类。假设起点训练区的地物光谱服从正态分布,根据样本数据计算得到各地类的方差、均值和协方差等特征参数,进而计算得到整体的先验概率密度值。最大似然法是建立在数理统计学之上的,利用特征参数建立辨别规则函数集合,根据函数集合计算所研究影像上各类像元的归属概率。利用最大似然法进行地物分类基本流程与马氏距离法相似。

2.2 非监督分类

非监督分类是在假定遥感影像上的同类物体在相同条件下具有相同的光谱信息特征下完成的。非监督分类的方法无需获取训练样本,而是在利用统计的方法计算统计不同地类的光谱差异规律的基础上实现对像元的分类。采用聚类分析的方法,将影像中的像元按照光谱相似性进行分类,分类的规则是:使属于同一类的像元间的特征距离尽可能小,而属于不同类的像素间的特征距离尽可能大。非监督分类方法主要包括:K-Means算法和ISODATA算法。

2.2.1 K-Means算法

K-Means算法[17]是一种反复迭代,最终将像元归并到附近最为邻近的地物类别中的算法。在计算获得初始类别值之后,其通过最小距离准则的影像所有像素迭代方法,每次迭代都需要利用新的均值来对迭代像元进行聚类。其思路为:任选的K个初始聚类中心,设定最小距离Di,将每个样本按照Di的分配标准,分配到K个聚类中的其中之一。然后,逐个计算出样本的均值,并将此均值作为聚类的中心,同时判断聚类是否有变化,若有变化,则重复以上步骤,直至聚类中心稳定为止。最后,可以得到聚类中心。其计算公式如下:

Di=min{|x-ci|}i=1,2,3,…,k

(2)

式中,Di为第i个数据集设定的最小距离,i取自然数,x属于数据集,ci为第i个数据集的聚类中心。

2.2.2 ISODATA算法

ISODATA算法[18]是通过计算特征空间中均匀分布的类别均值,以最小距离为原则将影像中的像元进行迭代聚类的。每次迭代完成后,需要重新计算以获得新的类别均值,之后利用新的类别均值对剩余像元进行迭代。

2.3支持向量机分类算法

支持向量机分类(Support Vector Machines,SVM)算法是一种基于统计学习理论的机器学习算法,用来求解不等式约束下的二次规划问题,采用结构风险结构最小化(Structural Risk Minimization, SRM)原则,在训练集中构造分类最优超平面。设分类方程为〈Xi·ω〉+b=0,则它要满足式:

Yi(〈Xi·ω〉+b)-1≥0

(3)

其中Xi,Yi为训练集中任意一点i的平面坐标。

由解析几何可知类间隔为D=2/‖ω‖,问题转化为φ(ω)=|ω|2/2使函数最小化,引入拉格朗日函数求解这一最优化问题:

(4)

其中αi为拉格朗日乘子,根据KKT条件,公式(4)中L为训练数据集中点到最优超平面的距离。这一问题的解必须满足式:

αi{[〈Xi·ω〉+b]Yi-1}=0

(5)

因此所得到判别函数:

(6)

一般情况下,大部分αi将为0,也有一部分不为0,其所对应的样本就是支持向量,b可由任一支持向量计算得到。

通常训练样本集中的支持向量比较少,也就是说SVM具有“稀疏性”,因此SVM的分类速度较快。SVM的实质在于将输入空间变换为高维空间,再在高维空间中进行线性回归求取最优线性分类面,而这种非线性变换是通过定义适当的内积函数实现的。

3 实验与结果分析

3.1实验过程

实验采用Z+F IMAGER 5010C三维激光扫描仪采集了建筑物墙壁、路面和花坛部分点云数据,共5个数据集。每个数据集约包含2万点,包含方砖、植物等多种地物。扫描仪距离大楼30 m,距离路面、花坛10 m,扫描仪点间距设为2 cm。

首先将获取的点云数据进行去噪处理,去除冗杂点和孤立点,保证数据质量。然后利用等距法获取标准间距的离散点,具体间距的设置要根据实际场景设置。部分标准间距离散点的选取如图4所示。

图4 离散点与参考点点位图 注:图中为部分数据栅格化后点位相对平面位置图,横、纵方向为Y、X,单位为m

然后将选取的参考点栅格化,生成栅格影像。栅格化后的部分数据如图5所示。地物包括岩石背景墙、绿植和陶瓷花盆。

图5 数据栅格化后影像

将生成的栅格影像分别用马氏距离法、最大似然法、K-Means算法、ISODATA算法、SVM进行分类。各方法对场景分类后的结果如图6所示。

图6 各方法分类后结果

3.2 实验结果分析与评价

经实验发现,相比于其他分类方法,基于支持向量机的图像分类方法,其分类器结构简单、容易训练且分类精度高。在选取合适参数的情况下,最大似然法和马氏距离法分类的精度低于支持向量机分类。对各分类方法的影像分类结果进行精度评价的方法是通过混淆矩阵来表示分类的精度。混淆矩阵中所包含的评价指标包括总体分类精度、Kappa系数、错误分差、错误分差、制图精度、用户精度六类,本文通对比较混淆矩阵中总体分类精度和Kappa系数的值得到分类算法之间精度差异。各分类方法混淆矩阵如表1所示,各分类方法精度对比如表2所示。

通过分类结果可以得出,支持向量机的地物分类方法有较高的分类精度和训练速度,与传统分类方法相比,支持向量机的分类方法在分类精度高的同时具有适应能力强、漏分和错分现象少、稳定性好等优势。通过实验可以看出,基于遥感影像的地物分类方法同样适用于点云数据栅格化后生成的栅格影像数据,并且各方法对栅格影像的分类精度较高,具有很强的可行性和适用性。

表1 各分类方法混淆矩阵 单位:个

表2 各分类方法精度对比

4 结束语

本文通过对点云数据的研究,提出一种利用栅格化后点云数据反射率信息进行地物分类的方法,用于激光点云数据的分类。通过研究,将采集的点云数据利用等距法获取标准间距离散点,然后将数据栅格化,并把点云数据的反射率信息作为栅格化后栅格影像的属性信息。用传统的分类方法和支持向量机分类方法对栅格化后的数据进行地物分类,从实验中可以看出,适用于遥感影像地物分类的方法同样能够适用于点云数据栅格化后的栅格影像,这为点云数据的分类提供了一种可行的分类新途径。

猜你喜欢

栅格聚类向量
一种傅里叶域海量数据高速谱聚类方法
向量的分解
栅格环境下基于开阔视野蚁群的机器人路径规划
一种改进K-means聚类的近邻传播最大最小距离算法
超声速栅格舵/弹身干扰特性数值模拟与试验研究
聚焦“向量与三角”创新题
AR-Grams:一种应用于网络舆情热点发现的文本聚类方法
一种面向潜艇管系自动布局的环境建模方法
反恐防暴机器人运动控制系统设计
向量垂直在解析几何中的应用