APP下载

基于KCPSO 算法对闽西地区崩塌地判释

2015-01-15李隘优

服装学报 2015年6期
关键词:适应度聚类向量

李隘优

(闽西职业技术学院 计算机系,福建 龙岩364021)

在判释崩塌地中,传统通常采用实地调查方法,能够准确判释崩塌地,但较多依赖专家经验,具有主观性;同时确定模型需要收集大量准确的工程地质和水文地质数据,需要足够的历史数据才能做出准确的评价预测,而且只适合较小区域评价,对于人力无法到达或面积过大的灾后地区要进行分析评估仍有很大困难[1-2]。为了提高分类精度,目前许多学者采用组合的算法,如采用粒子群优化(Particle Swarm Optimition,PSO) 方 法[3-4]与K-means 聚类(KPSO)算法[5-7]相结合,充分利用不同算法的优点,对于线性可分数据能够比较精确地找到聚类的个数,但它在线性不可分情况下找到的聚类个数和初始聚类中心往往是不理想的。文中提出将K-means 聚类分析、混沌搜索与粒子群最优化技术相结合形成混合群聚算法(KCPSO),以KCPSO 作为分类器判释遥测影像数据,以非监督方式对闽西大范围区域进行崩塌与不崩塌二元快速判释。并将KCPSO 与KPSO,CPSO 算法加以比较,进而分析出不同有效分类器的差异。

1 K-means 聚类算法

粒子群最优化算法(PSO)是一种以族群动力学为基础的演化式计算法则,它的基本概念来自鸟群或鱼群的社会行为的模拟。在一个社会化的群体中,每一个个体的行为不但会受到其过去经验和认知的影响,同时也会受到整体社会行为影响。在粒子群最优化算法中每一个个体在搜寻空间中各自拥有其方向和速度,并且根据自我过去经验与群体行为进行机率式的搜寻策略调整。其作法如下:

式中:d 为搜寻空间中变量的维度;i 为群体中的个体;vi为速度向量;X 为位置向量。Pi为个体所经历过最优解位置;Pg为个体所处整个邻域所记录的最佳解位置;c1,c2分别为自我认知学习因子与社会模式学习因子。

利用PSO 的搜寻能力协助人们在n 维的欧几里德空间Rn中,依数据的相似特性自动地将N 个样本数据区分成k 类群聚,并分别决定其群聚中心向量。首先,令PSO 演化族群中的每一个个体编码值为实数值所构成的字符串序列,它代表了k 个群聚中心。对于n 维空间而言,每一个个体的长度是k·n 个字符。而随机产生的初始族群也就代表了各组不同的群聚中心向量值。

确定个体的字符串编码后,再根据下列KPSO算法步骤执行:

1)决定初始族群个体数目以及相关参数。对第i 个体而言,它具有随机给定的位置以及速度。此处,个体的位置值即是所欲求得的各群聚的群聚中心值。

2)计算每一个个体的适应函数值。分别度量数据集中数据样本与群聚的距离,并依下面条件将样本归类至其最接近的群聚,文中采用所提出的距离度量相似性以得到目标函数,而系统适应函数则定义如下:

其中

3)将每一个个体求得的解与其经验中记录的个体最佳解进行比较,若目前求得解比之前最佳结果更佳,则以目前解取代个体最佳解。此外,若目前求得的解优于群体最佳解,则将群体最佳解重设为目前的结果。

4)将群体最佳解求值以单步的K-means 算法取代

为了节省计算量,同时维持PSO 能继续往搜寻空间的近似最佳解,文中建议在整体迭代过程的前几次迭代中执行本步骤即可。

5)根据式(2)、式(3)修改族群中各个体的位置和速度。

6)重复2)~5)等步骤,直至满足所设定的终止条件后结束循环的执行。

2 混沌粒子群优化算法

混沌粒子群优化算法(CPSO)的基本思想是将混沌状态引入到优化变量中,并把混沌运动的遍历范围载波变换到优化变量的取值范围,再把得到的混沌变量表示成粒子,根据粒子之间的合作与竞争进行搜索,到一定阶段给群体最优位置附加一个微小的混沌扰动,通过不断地更新粒子的速度和位置,最后求得问题的最优解[8]。

文中选用Logistic 映像[9]生成混沌变量,即

采用下式所示的线性映射将混沌变量变为优化变量

其中,b,a 分别为优化变量y 的取值区间上限与下限。优化搜索过程中,随着迭代的进行,混沌变量在[0,1]区间遍历,对应的优化变量则在相应的问题研究区间遍历,搜索问题的最优解。

根据混沌搜索的思想,如果当前迭代次数大于最大迭代次数的2/3 时,应在当前最优解中加入一个微小的混沌扰动量。

其中,β 为一个调节参数,0 ≤β ≤1;Z'为对应当前最优解向量映射X*加了微小扰动后的混沌向量;Z为由Logistic 映射产生的混沌序列向量;ψ*为当前最优解向量X*映射到[0,1]区间后形成的最优混沌向量,即

在CPSO 方法中,PSO 的gbest(t)可以被具有更好的适应度值的chaos(gbest(t))取代。

式中:t 为迭代次数;gbest(t)为群体中适应度最优的粒子位置;chaos(gbest(t))为经过混沌搜索过程粒子的适应度值;“>”是指chaos(gbest(t))适应度值比gbest(t)更好。

3 混合群聚算法

在PSO 结合K-means 将帮助PSO 聚类过程收敛,在PSO 采用混沌搜索将有助于提高gbest,文中提出基于K-means 与混沌搜索PSO 算法(KCPSO),将利用它们互补性特点去搜寻群体的最佳解决方案。因此,KCPSO 算法的建立应包括公式(1)、式(2)、式(3)、式(5)和式(10)。

在进化的初始阶段,对粒子进行了多样化混沌序列初始化,从而实现更好的gbest值,然后PSO 对pbest与gbest更新。在群体每次迭代过程中,混沌搜索和K-means 都按顺序执行,因此,PSO 的并行特性、遍历性、不规则性同混沌的伪随机性和K-means 聚类属性结合在一起,形成KCPSO 特性。图1 为模拟CPSO 迁移gbest过程。

图1 模拟CPSO 迁移gbest 过程Fig.1 Simulation process of CPSO migration

在一般情况下,KCPSO 会产生一定的规则指导群迁移,群成员将沿着这种关联规则进行进化。例如,混沌搜索可能会发现一个更好的粒子,以取代PSO 的gbest,与此同时包括适应度最小粒子的质心将不可避免地被消除。最终,更好gbest与聚类中心将有效地提高。

4 实验与分析

文中收集了2009 年闽西地区影像,全幅为12 000 m ×12 028 m,ASCII 矩阵为6 000 ×6 014 个像素,卫星影像经裁切划分出一个样本学习区,一个样本验证区。学习区长为3 098 m,宽为3 036 m,ASCII 矩阵为1 549 ×1 518 个像素,其地型包含了林地、草地、水体、崩塌地、裸露地;验证区长为2 855 m,宽为3 035 m,为了达到快速判释的目的,文中将验证区矩阵缩小,以达到快速判释的目的,像元转换后验证区的像元从2 m ×2 m 放大为5 m ×5 m,转成ASCII 验证区矩阵为571 ×607 个像素。为了确保研究的可行性,前往现场探勘4 次,拍摄一系列的现场相片,与卫星影像经仔细比对后,确认120 处数据确实为崩塌和非崩塌地正确样本数据。

首先建立研究区内崩塌地的空间数据库,先取样60 个样本点,将样本分为崩塌与非崩塌,其中包含林地、草地、水体、岩石地。将各时期卫星图的4 个原始波段和8 个影像中植生或土壤的辅助信息取出,由波段数据中萃取出重要因子。初期将各时段的影像分为两类:崩塌地与非崩塌地。从上述数据来源得到崩塌地的知识规则,并套用于验证区中,描绘出该地区哪里有崩塌的情形或是哪里有可能崩塌并设立崩塌危险区。本实验参数c1,c2取2.05,最大迭代次数为100,种群适应度方差阈值0.5,混沌系数μ 取0.8,其他为默认值。在二元判释中,将60 笔学习样本分别代入不同的分类器中进行分类,最后得到两类(崩塌地与非崩塌地)的资料群聚中心,以这些群聚中心作为测试的决策依据。知识规则建立之后,将验证区共三十多万个像元分成两类,图2 为其判释结果,深色部分为崩塌地,其他为非崩塌。

由于分类成众多类别,在分类时常发生类别与类别间的混淆。由于坡地滑动与土壤自身稳定性有关,坡度是控制边坡稳定性的重要因子,也是山坡地稳定最直接相关的地形条件,坡度越陡,越容易发生崩塌,发现坡度大于56%(约24.9°)的崩塌地具有较高的不稳定性,极易发生崩塌,因此崩塌地坡度阈值取24.9°,将地貌重新进行分类,剔除河道和裸露地的岩石,此岩石多半被误判为崩塌地,由于阈值的建立,改正易混淆的类别,以提升影像整体判释精度。

图2 不同算法判释结果比较Fig.2 Comparison of the interpretable results in different algorithms

为了比较不同算法的性能,表1,表2 对4 种聚类算法PSO,KPSO,CPSO ,KCPSO 在同一区域进行分类比较。

表1 判释的准确率Tab.1 Accuracy of interpretable in different algorithms

表2 经类别转换前后判释的准确率Tab.2 Accuracy of interpretable before and after conversion by category

由表2 可以看出,PSO 聚类的过程是很不稳定的,容易早熟,容易收敛到局部最优解,而且聚类的过程中可能会有振荡的情况出现,在较小适应度值出现时可能会有较差的情况出现,因此判释率不高;而对粒子群进行相应的改进后,先利用K-means进行聚类或混沌搜索,然后再利用粒子群,这样就在一定程度上改善了局部收敛,而且收敛的也较快,得到了较优的适应度值,整体判释率有所提高。KCPSO 算法则明显的优于粒子群,整体判释率提高了10% 以上,这说明用基于KCPSO 进行聚类,其目标函数收敛性能更好。不同分类器若采用崩塌地坡度阈值重新过滤,准确率都提高20% 左右,KCPSO达到的94.09%。

5 结 语

文中利用KCPSO 针对崩塌地进行分群判释,以基于K-Means 与混沌分类进行处理可算出影响崩塌地的重要属性,于灾后能快速掌握其资料以预测下次崩塌的发生进而加以防范,与利用不安定指数法配合崩塌潜势因子规划出崩塌潜势图或统计多变量分析相比,本方法能选出重要属性以减少数据量即可预测崩塌发生。本研究经崩塌实证分析后,还可在闽西地区范围进行实测,检验是否为当时崩塌地范围,因此日后可利用遥测技术实时快速分析的特性,配合数据萃取技术,绘出崩塌地预测判断图,对于防范崩塌地发生,可以作为其参考指标。

[1]曾山.模糊聚类算法研究[D].武汉:华中科技大学,2012.

[2]孙树林,余文平,刘小芳,等.基于信息熵与KPSO 聚类法滑坡敏感性分析[J].环境保护科学,2014,40(6):88-97.

SUN Shulin,YU Wenping,LIU Xiaofang,et al. Landslide susceptibility analysis based on entropy and KPSO clustering[J].Environmental Protection Science,2014,40(6):88-97.(in Chinese)

[3]周驰,高海兵,高亮,等.粒子群优化算法[J].计算机应用研究,2003,12(l):7-11.

ZHOU Chi,GAO Haibing,GAO Liang,et al. Particle swarm optimization(PSO)algorithm[J]. Application Research of Computer,2003,12(1):7-11.(in Chinese)

[4]吴昌友,王福林,马力.一种新的改进粒子群优化算法[J].控制工程,2010,17(3):359-362.

WU Changyou,WANG Fulin,MA Li.Improved particle swarm optimization algorithm[J].Control Engineering of China,2010,17(3):359-362.(in Chinese)

[5]王辉,张望,范明. 基于集群环境的K-Means 聚类算法的并行化[J]. 河南科技大学学报:自然科学版,2008,29(4):42-45.

WANG Hui,ZHANG Wang,FAN Ming. Research on parallelism of K-Means clustering algorithm based on cluster[J]. Henan University of Science and Technology:Natural Science,2008,29(4):42-45.(in Chinese)

[6]韩凌波,王强,蒋正峰,等.一种改进的K-Means 初始聚类中心选取算法[J].计算机工程与应用,2010,46(17):150-152.

HAN Lingbo,WANG Qiang,JIANG Zhengfeng,et al. Improved K-Means initial clustering center selection algorithm[J].Computer Engineering and Applications,2010,46(17):150-152.(in Chinese)

[7]王慧,申石磊.一种改进的特征加权K-means 聚类算法[J].微电子学与计算机,2010,27(7):161-163.

WANG Hui,SHEN Shilei. An improved feature weighted K-Means clustering algorithm[J]. Microelectronics and Computer,2010,27(7):161-163.(in Chinese)

[8]沈洪远,彭小奇,王俊年,等.基于混沌序列的多峰函数微粒群寻优算法[J].计算机工程与应用,2006,42(7):36-38.

SHEN Hongyuan,PENG Xiaoqi,WANG Junnian,et al. A PSO algorithm based on chaos sequence for multi-modal function optimization[J].Computer Engineering and Applications,2006,42(7):36-38.(in Chinese)

[9]梁慧.混沌粒子群优化算法的分析与应用[D].广州:广东工业大学,2011.

猜你喜欢

适应度聚类向量
改进的自适应复制、交叉和突变遗传算法
向量的分解
聚焦“向量与三角”创新题
一种基于改进适应度的多机器人协作策略
基于DBSACN聚类算法的XML文档聚类
基于高斯混合聚类的阵列干涉SAR三维成像
向量垂直在解析几何中的应用
基于空调导风板成型工艺的Kriging模型适应度研究
向量五种“变身” 玩转圆锥曲线
一种层次初始的聚类个数自适应的聚类方法研究