APP下载

基于脉冲耦合神经网络结合U-Net 的眼底血管分割*

2023-11-07梁玥莹桑海峰

微处理机 2023年5期
关键词:神经元像素卷积

梁玥莹,桑海峰

(沈阳工业大学信息科学与工程学院,沈阳 110870)

1 引 言

视网膜的病理变化与许多人类疾病密切相关。临床医学研究表明,视网膜血管网络的健康状况,不仅能反映眼部健康,还可以用于部分全身性疾病的早期诊断。运用视网膜血管分割技术,有助于临床工作人员更好解读图像信息。传统的手工血管分割工作量巨大,并且需要临床工作人员具有相当丰富的实际操作经验。因此,自动化的眼底血管分割技术具有重要的研究及应用价值。近年来,各类算法不断推陈出新,例如Ronneberger 等人[1]提出了用于细胞分割的U-Net 算法;杜新峰等人[2]提出了一种基于注意机制的金字塔场景解析U-Net 分割算法;Johnson 等人[3]则在深入研究Eckhorn 利用连接场模型(LFM)演示同步振荡的方法后,对其进行修改,以适应数学表达式。此后,PCNN(Pulse-Coupled Neural Network)因上述生物特征,被称为第三代神经网络。白培瑞等人[4]首次提出模糊连通性(CMFC)的特征矩阵,设计了FC-PCNN 模型的构建方案;丁雪梅等人[5]提出一种PCNN 参数设置自动寻优法,利用自适应分布式遗传算法(ADGA),将寻优得到的参数用于PCNN 血管分割;文献[6]提出了一个简单的脉冲耦合神经网络,可获得血管的基本结构。针对上述算法现存的问题,在此提出一种改进U-Net与改进PCNN 相结合的视网膜血管分割算法,尝试在保证分割准确性的同时保留更多的微小血管。

2 实验方法

2.1 数据集选取

选择对DRIVE、STARE 数据集进行实验来验证改进算法的网络性能。DRIVE 包含40 幅图片,分辨率为565×584 像素。STARE 有20 幅图像,分辨率为605×700 像素。全部60 张眼底图像中,每幅图像都有2 个专家手动标签。预处理阶段已将数据集中的原有图像采用随机切片的方式来对数据进行扩增。

2.2 网络总体框架

利用改进后的U-Net 模型对分块且初步增强的图片进行二次增强。其目的是多尺度提取血管特征。在U-Net 模型中采用Softpool 层、密集可变形卷积以及改进的SE 模块,用自适应阈值SSPCNN 网络进行精准的图像分割,以保证保留更多血管中的微小细节。总体网络流程图如图1 所示。

图1 网络总体流程

2.3 图像预处理

针对医学图像大都存在对比度差、边缘模糊等问题,首先对眼底血管图像进行灰度变换、标准化、对比度受限的自适应直方图均衡化以及伽马变换的操作以增强图像对比度。现有的医学图像数据集规模普遍较小,不利于提高模型的泛化能力,故采用随机分块的方式来对数据进行扩增。每一部分都是尺寸为48×48 的贴片,所有贴片都是通过在图像内随机选择其中心后分块获得的。

2.4 网络模型

2.4.1 改进U-Net 结构

原始的U-Net 模型存在获取特征不全面、易丢失局部特征的问题,因此为了多尺度、深层次提取血管特征,在U-Net 模型中采用Softpool 层、密集可变形卷积模块以及改进的SE 模块以获取更深层次的特征。改进后的U-Net 网络结构如图2 所示。

图2 改进U-Net 网络

2.4.2 密集可变形卷积模块

普通的卷积运算主要是用固定大小的感受野对输入特征图进行采样,然后对每个采样点和对应的卷积核进行加权求和运算。可变形卷积[7]运算在普通卷积的基础上增加了采样点位置的偏移量,使变形卷积网络能够更灵活地捕捉特征图的信息。可变形卷积的计算公式如下式:

上式中,m 和n 满足0≤m+Δm<Ir+Mr-1,0≤n+Δn<Ic+Mc-1,由此提出密集可变形卷积模块。它是一个三层结构的卷积模块,每层由不同的可变形卷积核构成,通过结合不同尺度和不同复杂度的多分支结构来丰富卷积块的特征空间,从而增强卷积的表示能力。不同尺度的卷积核提取图片的多角度特征信息,提升了网络的多尺度提取特征的能力。密集可变形卷积模块原理示意图如图3 所示。

图3 密集可变形卷积模块

2.4.3 改进SE 模块

SE 模块是一个轻量级门控机制。它可以通过对通道关系进行建模来增强网络的表示能力。在SE模块中,输入映射X ∈H ×W ×C 被变换(Ftr)为特征映射X∈H×W×C。在将X 馈送到下一个变换之前,它经历三个连续的步骤:挤压、激励和连接。通过全局平均池化将全局空间信息压缩(Fsq)到信道描述符中,并且采用门控机制来解决利用信道依赖性的问题,输出计算公式如下式:

SE 模块容易陷入局部最优,忽略目标的全局特征,导致在眼底血管分割任务中边界分割不准确。为此修改了SE 模块的原始结构,在挤压部分采用两种不同的池化方式使特征提取更具有全局性。修改后的Fsq内部结构如图4 所示。

图4 改进挤压模块

2.4.4 SoftPool 方法

选择SoftPool 作为本网络模型的池化方法,在保证池化层功能的前提下,尽可能地减少池化过程中的信息损失,提升血管分割的精度。SoftPool 方法主要是基于SoftMax 方法的加权池化。首先,定义大小为C×H×W 的特征图a 的局部区域R;然后,根据特征值非线性地计算区域R 的权重Wi;最后,通过加权区域R 内的特征值得到输出a。此过程可用以下公式来表示:

2.5 自适应SSPCNN 模型

2.5.1 自适应阈值的SSPCNN 模型

SSPCNN 模型是在简化的脉冲耦合神经网络SPCNN(Simplified Pulse-Coupled Neural Network)模型上做进一步的简化,去掉SPCNN 模型中的所有衰减系数而得到的。模型中单个脉冲耦合神经元的行为如图5 所示。SSPCNN 结构的相应数学公式如下各式所示:

图5 SSPCNN 网络结构

迭代中位置(i,j)处的神经元具有两种输入:主要与输入图像的位置(i,j)处的像素相关的馈送输入Fij[n],以及通过权重矩阵Wijkl与目标神经元周围的相邻像素的输出Ykl[n-1]建立关系的链接输入Lij[n]。这两个输入通过连接强度β合并,以产生内部活度Uij[n]。Uij[n]与Eij[n-1]进行比较,产生输出Yij[n]。如果Uij[n]>Eij[n-1],神经元将被触发(Yij[n]=1),动态阈值Eij[n]将增加幅度VE。动态阈值Eij[n]及连接强度β这两个参数对于图像分割的结果至关重要,故提出自适应阈值的SSPCNN 网络来确保分割的准确性并提高模型的泛化能力。

2.5.2 自适应阈值分析

对于SSPCNN,对应于具有OMax强度的目标像素的神经元在时间t=T(OMax)的自然脉冲,其中,OMax是目标像素的像素最大值;T(OMax)是阈值信号从其最大值θMax衰减到OMax所需的时间。在快速链接而导致的二次激发期间,令下式成立的对象神经元将被捕获:

式中,Lij(T(OMax))是Nij从其8-邻域接收的总链接输入;Nij是对应于像素(i,j)的神经元;Xij是像素(i,j)的强度,该像素是Nij的馈送输入。类似地,令下式不成立的所有背景神经元也将被捕获:

若有一个β值,令式(10)对所有目标神经元都成立,而式(11)对所有背景神经元都成立,那么只有目标神经元可以在T(OMax)处一起放电,从而导致输入图像的完美分割。当不可能完美分割时,则要尽可能捕获最大数量的目标神经元和最小数量的背景神经元。式(10)指定了β的下界β1,式(11)则指定了β的上界β2。β1的值随着强度之比OMax/OMin的增大而增大;β2的值则随着比值OMax/BMax的减小而减小,其中BMax指的是背景像素的像素最大值。如能有效降低β1和增加β2,即可提高分割精度,故可采取局部确定阈值的方法。

2.5.3 自适应阈值确定流程

至此需要确定全局连接系数和初级点火阈值流程。首先将图像粗略分割成目标和背景的阈值T。阈值T 使用大津法获得。使用强度大于T 的图像像素近似对象像素的强度均值m0和标准差σ0。使用强度小于或等于T 的图像像素来近似背景像素的强度均值mB和标准差σB。主激发阈值PFT 应大于T,以防止明亮的噪声背景像素在主激发期间激发。由此可得PFT 计算公式如下式:

其中,k 是大于零的常数。通常,k 在[1,2]的范围内。计算链接系数,使得以下不等式对于所有对象神经元都成立:

已知最小物体强度应小于对象像素的强度均值m0,主激发阈值应大于T,最小物体强度大致取(Tkσ0)。在目标神经元的8-邻域中,期望目标神经元比背景神经元多是合理的,假设单位链接,目标神经元的LI(t)的最小值可以取为5。至此,连接系数β的计算公式如下式:

3 实验结果与分析

3.1 性能评价指标

想要判断血管分割的优劣情况,需要有效的性能评价指标。可以将图像分割的结果与标签进行比较,图像中每个像素点的分类情况属于下述四种情况之一:真阳性(TP)、假阳性(FP)、真阴性(TN)以及假阴性(FN)。通过像素点分类情况可以进行灵敏度(Se)、特异性(Sp)和准确度(Acc)这三个常用性能指标的计算。计算方法如下:

3.2 分割结果对比分析

在DRIVE、STARE 两个数据集上使用灵敏度、特异性、准确率作为评价指标。分割后得到各项数值如表1 所示。

表1 分割结果对比分析

在DRIVE 数据集上,与基准方法相比,三种评价指标都略有提升。其中灵敏度提升最高,说明本算法能将大部分背景像素与目标像素正确分类。在STARE 数据集上,虽然灵敏度数据较差,但是特异性、准确度与基准方法相比均有不同程度的提升。部分分割结果如图6 所示。

图6 部分分割结果

3.3 U-Net 与自适应SSPCNN 结合

U-Net 对眼底血管图片进行分割时会发生分割后的血管存在血管断裂的情况,PCNN 网络的耦合特性能够很好地弥补这一问题。故初步采用U-Net网络对眼底血管图片进行图像增强处理,之后再利用自适应阈值SSPCNN 对血管进行精确分割。采用这一处理的分割效果如图7 所示。

图7 U-Net 与自适应SSPCNN 结合使用的分割效果

3.4 可变形卷积有效性分析

传统卷积核的最大问题集中在适应性差、血管分割细节丢失等方面。若使卷积核可以根据实际情况调整本身的形状,便可更好地提取输入特征。应用可变形卷积后,相比于原始模型,在三个评估指标上都有不同程度的提升,详细结果如表2 所示。

表2 卷积与可变形卷积分割结果对比

3.5 SE 模块改进的有效性分析

传统的SE 模块对于眼底血管这种管状物分割存在忽略部分特征的问题,会对后续的分割结果造成不可逆转的影响。相比于原始模块,改进后的模块在三个评估指标上都有不同程度的提升,详细结果如表3 所示。

表3 SE 与改进SE 分割结果对比

3.6 自适应阈值SSPCNN

原始的PCNN 网络需要人工设置大量参数,为分割工作造成了极大不便。经过大量实验表明部分参数对分割结果影响并不大,故采用SSPCNN 模型进行最终分割,同时使用自适应阈值的方法。

自适应阈值SSPCNN 与硬阈值SSPCNN 的分割结果对比如表4 所示,由表中数据可见灵敏度有明显的提升。

表4 硬阈值与自适应阈值分割结果对比

4 结 束 语

本设计应用密集可变形卷积模块、改进的SE模块及SoftPool 的U-Net 网络对图像进行初步增强,使其能够统筹深层特征以及浅层特征,多尺度地提取眼底血管特征,使网络更具有全局能力。新方法兼具准确度与灵敏度,在相当程度上解决了图像处理中由于分割不充分而出现诸多问题。初步研究取得良好效果,但在保证连接断裂血管的前提下,部分图片仍会出现噪点增多的情况,在灵敏度升高时特异性略有下降。如何在保证精确度的情况下提高特异性也将是后续进一步研究的主要方向。

猜你喜欢

神经元像素卷积
赵运哲作品
像素前线之“幻影”2000
《从光子到神经元》书评
基于3D-Winograd的快速卷积算法设计及FPGA实现
“像素”仙人掌
从滤波器理解卷积
跃动的神经元——波兰Brain Embassy联合办公
基于傅里叶域卷积表示的目标跟踪算法
高像素不是全部
基于二次型单神经元PID的MPPT控制