APP下载

群智能优化算法及其在PPI网络中的应用研究

2021-12-14颜玲

网络安全技术与应用 2021年11期
关键词:布谷鸟中心点聚类

◆颜玲

群智能优化算法及其在PPI网络中的应用研究

◆颜玲

(湘中幼儿师范高等专科学校 湖南 422000)

在当前背景下,人类基因组计划、生物信息技术得到了飞跃的发展,随着生物数据的大规模增长,对蛋白质的研究力度也在不断增加。蛋白质本身并非分离组织之间密切结合,且发挥着不同的功能。蛋白质之间相互作用的理念,应用在网络聚类上,能够深入研究病理学,可助力于疾病的诊断,并促进生物学、生物信息学、医学等领域的发展。近几年,很多研究人员提出了群体智能优化算法,且将其应用在各个领域当中,但在使用与发展中,各自也存在着一定的局限性。布谷鸟算法本身简单,搜索易于实现,且需要的参数较少,其组成最为关键的部分为随机游走、偏好随机游走等,使用效率较高。本文研讨的是蛋白质+布谷鸟搜索的作用网络,对其评价方式进行针对性的研讨。

群智能优化算法;PPI网络;研究

近年来,人们就蛋白质相互作用进行了探讨,且对于其相互作用在网络聚类中的应用进行了大量的研究,且被广泛应用在聚类算法当中。良好聚类算法,会影响蛋白质组学,且属于直接的影响,能够促进相应的发展。通常情况下,簇具备特定的作用,其识别也是一门艺术,能够组建蛋白质复合物,可展现不同的功能模块。但是,随着聚类算法数量的增加,也产生了新的聚类,生物学家将结果应用在生化实验之前,其正确地评估十分的关键。不同聚类方法,可获得差异较大的聚类数量、聚类大小,公平、合理的评价方式属于当前的难点。

1 群智能优化算法

群居昆虫的集体行为被称为“智能”。个人的行为非常简单,但是在共同作用与努力之下,强调复杂的行为特征,并促进新的进化技术,展现群体智能的研究特点。其与人工生命有一定的特殊关系,涵盖了进化策略、遗传算法等。

1.1 细菌觅食算法

在自然界当中,大肠杆菌可借助自身的鞭毛,在可知环境内不断的游走,并找寻食物。有研究表明,在食物紧张的环境内,细菌会随机选择一个方向,并试图朝那个方向游一次。如果游泳后发现新地方食物充足,则继续。这样,它就可以向前游到游泳台阶的门槛。如新地点的食物,并不比原地点的丰富,细菌会重新开展选择,且为随机选择,继续进行食物的搜索。笔者认为,细菌的生存与达尔文的理念十分的契合,在当前环境中,假设食物丰富,细菌会分裂,产生不同的新个体;若是恶劣的环境,则细菌会出现死亡,或者是出现迁移现象。细菌采集优化算法本身在大肠杆菌基础上的新型仿生算法,能够进行大肠内吞咽行为与咀嚼行为,属于全军随机搜索的算法。这一算法的步骤主要包括:趋向性、复制性、迁徙性。

1.1.1 趋向性操作

搜集细菌在营养丰富区域的行为,在此过程内,其行为被称之为游泳、旋转,细菌沿着指定的方向叫游泳,随机方向被称之为旋转。如果细菌后明显改善健康的新职位价值完整的旋转,它将继续朝着这个方向走,直到健康值不在预定阈值改进或移动一步。当位置变得糟糕,细菌会继续旋转。

1.1.2复制操作

在食物极其丰富的环境中,当细菌在生命期的结束,他们将成为趋化作用,而不是繁殖。细菌由两个部门创建一个新的实体,能够收集与自己相同。基本的生殖过程要遵循“适者生存”的原则,依照耐细菌趋化性的特点,其积累的细菌收成不好,死一半,另一半会回到良好的细菌,这样我们就能够加快搜索的速率细菌。

1.1.3迁徙操作

细菌所在的位置不好,缺乏食物和细菌,可以杀掉一个细菌,和新个体随机合成的解空间中,细菌有差异的收集能力。那些新个体随机合成的迁移具体任务可能更趋近全局最优化的解决方案,这将帮助他们不落入局部最优化找到全局最优化解。

1.2 布谷鸟算法

布谷鸟有一种特殊的繁殖行为,叫做巢寄生。在繁殖的季节,其可以找到新鲜蛋,或者是繁殖的宿主,蛋的形状与颜色比较容易模仿,将鸡蛋放在宿主的鸟巢内进行孵化。考虑布谷鸟蛋的大小、宿主差异,认为两者不存在明显的差异,很难找到宿主。遵循李维斯的随机行走理念,假设步态长度与分布较为稳定。这些散漫的步态多为近距离地交替进行,且不停地进行探索,开展长距离的散步。借助智能优化算法,引入专门的Levi Flight技术,能够扩展搜索范围,可确保整体的多样性,能够实现全局优化,构建轻松的局面。布谷鸟的繁殖行为与李维斯提出的飞行行为较为相似,本文设计了一种布谷鸟搜索算法,以此模拟布谷鸟的筑巢。布谷鸟搜索算法建设的三种理念主要包括:(1)布谷鸟一次只可下蛋1个,且随机进行孵化选择;(2)随机选择一组鸟巢,将最好的鸟巢留给下一代;(3)可选择固定的巢穴数量,知晓巢穴的外来PA。布谷鸟在其孵化阶段,其与生长产物比较相似,发现的可能性也随之降低,数值一般控制在0-1的区间范围之内。

李维斯飞行属于随机行走的一类,其行走的步长比较的稳定,重尾在多氛围下进行。属于形式内的行走,能够开展短距离的探索。也可偶尔开展长距离的行走,通过将智能优化算法纳入其中,可实现搜索范围的扩大,增加种群的多样性,以此实现局部最佳。最为关键的是,能够将局限性突破。

基于此,本文选择的布谷鸟算法,其流程主要如下;

Step1:目标函数为f(X),假设初始群体为X=(xr,x2,…,xa)T,随机产生n个鸟窝,其初始位置 X(i=1,2,…,n),设定相应的位置参数,并将其表现出来;

Step2:计算鸟窝内的目标函数值,将最优解详细的(地)记录下来;

Step3:保留之前鸟窝的位置,结合位置,更新公式,并将其他鸟窝位置更新;

Step4:对比两代鸟窝,若不存在缺陷,需要选择最佳的位置;

Step5:用随机数R,看作是鸟窝主人发现外来鸟蛋的概率,与Pa对比,假设P比Pa大,随机改变鸟窝的位置,以此获得全新的鸟窝位置;

Step6:若未能契合结束条件,则返回到第二步,确保输出位置属于全局内为最优位置。

2 基于布谷鸟搜索机理的网络聚类算法研究

二十世纪下半叶,启发式智能算法出现,其将遗传、蚁群、粒子聚类算法包含其中。通过模拟生物行为,借助自然现象,可实现问题的优化。其属于计算机算法设计、计算机分析领域的特点。结合rhododendron算法,本文借助相应的建议,简单有效地将其应用在蛋白质作用网络内,其搜索路径良好,仿真结果也比较好。

2.1 蛋白质结点之间的相似性

在蛋白质网络中,有m行n列载体Xm。表示m与n之间蛋白质的相互作用,可反应效应的大小。若是两种的蛋白质之间存在相互的作用,则将两种蛋白质相互作用的大小定义为两种蛋白质之间的权重值,如果两种蛋白质相互分离,则该值定义为零。

2.2 目标函数

在蛋白质的网络当中,k节点度定义相连蛋白质节点,可展现清晰的边数,节点Wd的权值表示与该蛋白质节点相连的所有边的权值之和。一个节点的加权聚合度WK是与该节点相连的所有节点(除其他节点外)的两两权值之和。相互作用在加权蛋白网络内,可获得复合特征价值。该网络综合特征值不仅将模块蛋白质与周围蛋白质考虑其中,并探寻其连锁关系,结合蛋白质意外的连锁强度,调整了蛋白质的比例。每一部分的形状和组成。因此,它可以作为衡量蛋白质网络聚类结果的目标函数。

2.3 基于布谷鸟的搜索机理

PPI网络聚类算法的解释是对原始数据进行分割,使分割后的组具有特定的意义或有用性。当人们进行分化时,他们的基础是尽可能促使同类型的东西相似,不同类型的尽可能不同。蛋白质网络具备显著的模块化特点,其可聚集在一起。就蛋白质网络的类,一簇蛋白质的相似度较大,与不同组别蛋白质的相似度很少。这一算法的应用,能够确保较好的聚类效果。使用布谷鸟算法开展聚类时,每个布谷鸟对应一个蛋白质,鸟巢则对应聚类中心。在集群化前,需要预处理相应的数据。

2.3.1数据的预处理及候选中心点的选取

为更好地开展数据处理,我们用数字给蛋白质命名,也就是说,我们给每个蛋白质分配一个数字。这导致程序运行阶段,数据计算得到有效简化。算法可实现快速的运算,能够有效计算。在初始化聚类中心之后,能够将网络节点结合,可以包含网络边缘的相关信息,以此借助网络综合特征,展现其利用率,凸显不同的阈值,进行中心点选取。如果网络的组合特征值大于给定的相关阈值,节点属于初始簇中心。为加速收敛速度,实现速度的提升,需要展现种群的多样性,簇中心为M群。确保每个组的聚类中心不会出现重复,确保各个组之间的聚类中心出现重叠。

2.3.2算法的具体步骤

步骤1:根据数据预处理的程度和阈值以及综合网络特征值选择候选聚类中心,初始化zucluster,设置参数度的阈值d rhreshold,综合网络特征值的阈值。相似度阈值sim阈值,最大迭代次数maxiter和访问的访问ID。

步骤2:根据李维斯的飞行从候选解决方案中随机选择一组m个鸟巢(集合中心)。每组有n个鸟巢。如果有两组完全相同的鸟巢,则我们随机选择以下一组之一:它是一个重叠的组。m组的鸟巢根据相似度分别聚类,相似度越大,发现异卵的可能性就越小,从而获得m组聚类的结果。

步骤3:根据适应度值,按升序对m组和zuchuster的聚类结果进行排序,选择最合适的组并将其记录为当前的zucluster。依次,我们将每个组的适应度值较大的聚类模块与适应性值最小或最新zucluster中聚类中心相同的模块进行比较。如果群集中心相同,我们将使用适合性更高的模块替换现代zucluster。比较后的价值。同中心内,适应值较小模块,其群集中心展现不同的特点。现代zucluster内,若适应值大于最小模块的适应值,可将其替换掉。为下一代保留最佳的聚类结果。

步骤4:如果r=+ 1,Kmaxiter,请返回步骤2,否则请转到步骤5。

第5步:打印出最佳的群体解决方案zucluster并评估结果。

2.3.3聚类过程细节

(1)开始聚类时,它不是从传统上与所有聚类中心进行比较,而是从每个聚类中心开始,并根据邻域逐层进行。

(2)由于新嵌套的数量是固定的,所以在聚类过程中,如果相邻节点是另一个满足相似性阈值的中心点,则该相邻中心点将从候选中心变为聚类中心。它尚未被访问过,并且与该组的原始群集中心不重叠以填补既往的空缺。

(3)在对比每组聚类结果、最佳组结果期间,需要将聚类中心确定,查看其是否为最佳组内的聚类中心成员,如果是,则找到最佳组位置上的位置并同时执行比较。否则,在排序之后,将其与最佳组的第一个元素进行比较。

2.4 性能分析和实验仿真

该算法的成本与节点数N本身属于线性的关系。若是在最坏的情况下,未见明显的噪声,未能找到噪声点,针对遍布在网络内的每个节点,算法时间的复杂度则用O(N)表示。

分析算法时,效率主要体现在两点:

(1)中心点的选择遵循蛋白质网络的非标准和亚世界特征,并且实际上选择了更可能的中心点。当围绕它们进行聚类时,遍历首先基于宽度,从而避免了将所有节点与所有中心点进行比较的传统成本。

(2)从中心点开始遍历时,将尚未访问的另一个中心点作为一般中心点,并且如果满足阈值条件,则将其归为此类,从而避免后续模块合并。

3 结束语

综上所述,本文分析可得知,在蛋白质相互作用内,纳入布谷鸟算法,聚类内算法能够在新窗口对应聚类中心。新的鸡蛋能够对应单一的蛋白质,簇则是其分割的结果。为实现解决方案质量的提升,每个时代均选择m聚类中心组,在聚类之后,对比一般组的最佳模块,在最佳组内替换掉最差模块,将聚类的收敛性提升。基于此。本文设计的聚类,能够实现重要参数的讨论,结果表明,网络参数相似性与综合性有效,其算法优于人工与功能算法,有效性比较显著。

[1]吴春琼,鄢冰文,郁榕睿,等.群智能优化算法下网络舆情信息的认知与应对[J].信息系统工程,2021(01):70-73.

[2]温晓珍. 融合定位机制修正与种群智能优化的无线传感器网络定位算法[D].江西理工大学,2020.

[3]张标. 基于多属性决策与群智能优化的异构无线网络选择算法[D].华南理工大学,2019.

[4]丁玉连. 基于群智能优化的动态蛋白质复合物和关键蛋白质识别算法研究[D].陕西师范大学,2017.

[5]刘衍民.神经网络稳定性及在群智能优化算法中应用研究[D].遵义师范学院,2016.

[6]尤梦丽. 群智能优化算法及其在PPI网络中的应用及评价研究[D].陕西师范大学,2014.

[7]冯红红. 群智能优化算法及其在无线传感器网络布局中的应用[D].吉林大学,2012.

[8]黄旭. 群智能优化算法及其在PPI网络中的应用研究[D].陕西师范大学,2011.

湖南省教育厅科学技术研究重点项目(20A450);湖南省教育厅科学技术研究一般项目(19C1808)

猜你喜欢

布谷鸟中心点聚类
布谷鸟读信
布谷鸟读信
一种基于标准差的K-medoids聚类算法
Scratch 3.9更新了什么?
基于K-means聚类的车-地无线通信场强研究
如何设置造型中心点?
基于高斯混合聚类的阵列干涉SAR三维成像
布谷鸟叫醒的清晨
基于Spark平台的K-means聚类算法改进及并行化实现
基于改进的遗传算法的模糊聚类算法