结合FCM聚类和边缘感知模型的眼底渗出物检测

2020-06-09刘俊涛王素娟林晓明刘祚时谭俭辉

计算机工程与应用 2020年11期

关键词：渗出物视盘亮度

刘俊涛，王素娟，，林晓明，刘祚时，谭俭辉，宋丹

1.江西理工大学机电工程学院，江西赣州341000

2.广东顺德创新设计研究院，广东顺德528311

3.广东工业大学自动化学院，广州510006

4.桂林理工大学信息科学与工程学院，广西桂林541006

1 引言

最近三十年里，由于人们饮食习惯的变化和生活质量的提高，全球成人中患有糖尿病的人数翻了一番，尤其在中低收入国家增长迅速。据世界卫生组织预计，2030年后，在全球致死病因中糖尿病将排第七位[1]。对于长期患病的糖尿病患者，往往会由于血糖浓度的增高诱发各种糖尿病并发症，其中比较严重的并发症之一就是DR。在DR 患者的眼底图像中常常会表现出一系列不同病症，若患者在患病初期能够通过眼底筛查及时发现，不仅可以挽救视功能，还能为其节省大量的财力物力。目前，一些国家想通过DR普查计划在这些并发症恶化之前鉴别出一些高危患者并督促其进行早期治疗[2]，但是此计划常常伴随人口基数大、医疗力量不足等问题。因此，利用计算机图像处理技术可以辅助医疗人员对DR高效筛查和准确诊断。

眼底图像中渗出物的出现意味着DR 已经进入早期阶段，渗出物的形态大小多呈边界比较清晰明了的黄白色点片状。当出现形态不同、边界模糊的灰白色片状的渗出物时，意味着眼底动脉处的血压控制不佳，眼底神经纤维出现了梗塞，即将进入DR的下一个阶段。因此，对眼底图像的渗出物进行检测可以实现对DR的早期诊断[3]。

目前，很多学者对眼底图像中的渗出物进行了研究，大部分研究方法是交叉的，但主要分为四种方向。一是阈值方法，García M 等通过结合全局阈值和自适应阈值实现渗出物的自动识别[4]；Ege B M等提出一种基于灰度阈值的简单渗出物检测方法，通过结合其他分类器算法得到最终的渗出物区域[5]。二是数学形态学方法，Zhang等利用数学形态学的方法检测出候选病灶区域，然后利用随机森林算法得到精确的渗出物区域[6]；Imani E等利用形态学成分分析算法将病变结构与正常视网膜结构分开，然后用动态阈值和数学形态学方法实现了渗出物区域的自动分割[7]。三是背景估计方法，Fu等开发了一种基于RPCA的变化检测方法，此方法可以得到视网膜眼底图像的纵向变化图像，通过低秩分解将纵向变化图像分为背景分量和前景分量，前景分量即为病变区域，该方法有效性强、诊断范围广泛[8]；Xiao等利用结合基于形态学的背景估计和kirsch 算子得出候选病灶区域，最后通过SVM 完成对渗出物的精确提取[9]；Sopharak等利用结合FCM聚类算法和基于形态学的背景估计实现了对渗出物的自动检测[10]。四是机器学习方法，Hashim 等利用基于纹理特征结合支持向量机（Support Vector Machines，SVM）和多层感知器（Multilayer Perceptron，MLP）的方法实现了对渗出物的分割[11]；Fraz 等利用面积、亮度均值等作为特征，利用决策树分类器实现了对硬性渗出物的分类和检测[12]；Prentašić 等使用一种传统深度卷积网络实现了对视网膜图像中渗出液的检测[13]；Gwenolé等提出用ConvNets将视网膜眼底图像中的病灶区域生成热力图，接着再实现对不同病变特征的分类和分割[14]。

由上述文献分析可见，阈值方法极易受图片质量的影响，单一的阈值处理很难实现对渗出物的精确提取；数学形态学方法虽然计算简单高效，但其实现过程极易遭受噪声的影响，鲁棒性不强；背景估计方法容易受到眼底图像中个性化区域的影响将一些眼底正常区域误分割为病灶区域；而机器学习的方法对特征的选择和硬件设备的好坏极为敏感。对文献[15-17]的分析发现，上述文献都是利用FCM 算法得到包含伪病灶的候选病灶区域，然后利用分类器从中筛选出精确的渗出物区域，而分类器的设计和相关特征的选取过程通常十分复杂。文献[18]中提到FCM 能够有效解决医学图像上普遍存在的模糊问题。基于此，本文提出了一种结合FCM 和边缘感知模型的眼底渗出物检测方法，主要通过判断由FCM 得到的候选渗出液区域与其邻域灰度差异是否满足视觉模型相关参数条件从而筛选出真实的病灶区域，避免了分类器设计和特征选取的复杂度。整个算法过程如图1 所示，首先对眼底图像进行亮度校正、对比度受限自适应直方图均衡化（Contrast Limited Adaptive Histogram Equalization，CLAHE）和阴影修正得到对比度增强和光照均衡的图像，然后通过FCM 得到渗出物的候选目标，最后利用边缘感知模型和移除视盘获得真正的渗出物区域。

图1 检测渗出物的算法流程图

2 候选渗出物的提取

2.1 预处理

由于原始眼底图像存在光照不均和对比度不强的问题，为了后续处理过程能够得到比较完整的候选区域，有必要对图像进行一系列预处理以增强对比度和均衡光照，大体的预处理过程如下：

为了提高算法效率，将图像大小统一调整为963×712。

步骤1 对像素点(i,j)在HSV空间图像中的亮度值V(i,j)进行校正得到Bc(i,j)，最终得到的效果图如图2所示，其中（a）是原始图像I ，（b）是亮度校正后的图像Ibc，所用到的转换公式如下：

图2 眼底图像预处理

步骤2 CLAHE是针对数字图像特别是医学图像低对比度问题的方法，其在医学图像的处理上使用相当广泛[19]。对于眼底图像而言，RGB通道图像中绿色通道包含的特征最多，其次是红色通道，用处最小的是蓝色通道，渗出物在绿色通道中最为明显，因此本文主要针对绿色通道图像进行一系列处理。对经过亮度校正的图像Ibc先进行CLAHE 处理，效果图如图2（c），再提取出绿色通道得到图像Ig，如图2（d）所示。此处未对绿色通道图像直接进行CLAHE 处理，因为此方法得到的图像噪声较大，不利于后续处理。

步骤3 由于眼底图像成像条件的限制，在经过一系列预处理后图中还是存在光照不平衡，这会给后面的候选渗出物的提取带来极大的误差。阴影校正可以用于将视网膜特征与背景分离，能够有效改善图像光照不平衡的现象。阴影校正后的图像Isc是利用图像Ig减去近似于背景的图像Ibg所得，该背景图像Ibg通过一个大小为100×100的中值滤波器平滑原始图像获得，中值滤波器的尺寸稍大于原始图像中最大的视网膜特征。背景图像如图2（e），阴影校正后图像如图2（f）。

2.2 FCM聚类提取候选渗出物区域

FCM聚类算法是一种基于目标函数的无监督模糊聚类算法，在图像处理应用中，对具有不确定性和模糊性比较大的像素点的分类能起到很好的作用。对于图像分割而言，FCM 聚类会根据每个数据点的隶属度来确定这些数据点从属于某个中心，然后由图像中像素和聚类中心的加权相似测度，对目标函数进行迭代优化以确定最佳聚类。应用在图像处理中的FCM聚类的目标函数及其约束条件分别为：

式中，n 是图像像素点的总个数，xj是第j 个像素的像素值；c 是聚类中心点的总个数，即聚类类别数，vi是第i 个聚类点的像素值；m 是加权指数（图像处理一般取2），uij是第j 个像素点属于第i 个聚类的隶属度；||xj-vi||是指xj与vi之间的欧式距离。

FCM聚类算法的具体迭代过程算法如下：

输入：数据集X={x1,x2,…,xn}。

输出：数据集聚类中心和聚类结果。

（1）确定聚类中心个数c ，加权指数m 以及算法终止阈值ε，设定初始迭代次数为t=1，最大迭代次数为tmax。

（2）确定初始聚类中心vi。

（3）根据当前的聚类中心数和聚类中心计算每一个像素点属于每一类的隶属度：

（4）根据当前的隶属度更新各聚类中心：

（5）选取合适的矩阵范数，若m 满足条件V(t+1)-V(t)≤ε 或t ≥tmax，则停止运算过程，输出最终聚类中心点和聚类样本集合；否则，转至步骤（3）。

在应用FCM 聚类处理图像分割问题时，特征图像和聚类中心点个数c 值的选取至关重要。特征图像的选取会直接影响最后聚类结果的精度。对于聚类中心点总个数c 值而言，其选取过小会导致分割结果范围过于宽泛，部分渗出物会与眼底正常亮特征混杂，为后期渗出物的精细提取带来很大麻烦；反之c 值选取过大，会造成图像的过度分割，一些渗出物区域会被遗失。经过大量实验证明，选取经过CLAHE 处理后的绿色通道图像Ig和阴影校正后的图像Isc作为特征图像数据集，且当c=4 时，FCM 聚类算法能够提取出绝大部分的渗出物，最终的聚类结果如图3 所示，选择其中的第二类作为候选图。

图3 聚类结果图

当聚类完成后，算法会返回最终的聚类中心像素值（也即终止阈值），表1给出了Ig（CLAHE处理后的绿色通道图像）结合Isc（阴影校正后的图像）作为特征图像数据集的终止阈值。限于篇幅，表1只列出了数据库中10幅图像的终止阈值，其中第三行即为上述图像的终止阈值。

表1 双特征图下FCM聚类的终止阈值(Isc+Ig)

3 渗出物区域的精细筛选

经过上述一系列处理得到的候选渗出物区中，除了真实的渗出物外还包含了一些正常眼底特征和掩模边缘片段等伪渗出物区域，为了得到真正的渗出物，本文提出了结合边缘感知模型筛选方法，滤除那些伪渗出物区域。由于视盘的亮度特征与渗出物区域的亮度特征比较相似，但视盘的位置和形状特征相对固定，因此在最后阶段对视盘进行单独去除即可得到真正的渗出物区域。

3.1 边缘感知模型

专家对眼底图像中渗出物的诊断是基于判断渗出物区域与其周围背景正常区域是否存在恰当的亮度差异而给出的，当其不小于人眼能看到的最小亮度差异时，结合专家的先验知识即能排除伪渗出物区域，推断出真实的渗出物区域。本文提出的边缘感知模型将通过模仿专家的诊断机制来实现对伪渗出物区域的识别与排除，首先将眼底图像中的灰度值代替亮度，然后计算出渗出物区域与其邻域之间的灰度差是否大于或等于人眼视觉模型中的临界亮度差，若满足条件则对此区域进行保留，反之则排除。

在人眼视觉模型中，人类对物体的感知并不单一靠物体自身的亮度来实现，更大程度上取决于物体背景的亮度，当物体自身亮度与物体背景亮度存在一定亮度差时，才能在该背景亮度下观察到该物体，当亮度差刚刚达到人眼可见的亮度差时，称其为临界亮度差。根据韦伯定律[20]可知，临界亮度差D(L)与背景亮度L 之间是存在非线性关系的，该非线性关系主要可以通过韦伯比D(L)/L 与背景亮度L 的关系曲线（如图4所示）可知。

图4 韦伯比曲线

根据韦伯比曲线图可知，当背景亮度L 小于a 时，临界亮度差D(L)会随着背景亮度L 的增大而缓慢变化，此时可以将亮度差近似成常数；当背景亮度L 处于a 和b 之间时，韦伯比近似为常数，此时的临界亮度差D(L)与背景亮度L 之间呈线性关系；当背景亮度L大于b 时，临界亮度差D(L) 与背景亮度L 之间呈指数函数关系。因此，临界亮度差可由下列分段函数[20]得出：

式中，参数α 是核心参数，其取值可参考韦伯常数，取值范围为[0.01，0.3]；初始灰度值a 的取值范围为[45，81]，终止灰度值b 的取值范围为[180，210]，当选定参数a,b,α 的值后，根据韦伯比曲线的连续性可求得参数C，β 的值分别为式（7）和式（8）所示，本文中，取a=45，b=180,α=0.2。

得到上述临界亮度差后，计算出候选渗出物区域及其周围邻域的平均灰度值分别为L0和L1，周围邻域范围用原始候选区域膨胀后的区域减去原始候选区域得到，膨胀用到的结构元素是半径为3 的圆盘结构，平均灰度值可以用式（9）来计算；通过L0和L1计算出两者的灰度差ε，判断其与D(L)的大小关系是否满足式（10）。

式中，S 代表的是灰度值范围[0，255]，n 是指对应区域的灰度值的数量。具体算法步骤如下：

（1）读入经过CLAHE 变换的绿色通道图I1和由FCM聚类得到的候选区域掩模图I2。

（2）标注且计算I2中的连通分量，创建一个尺寸大小与I2相同的空白图像I0。

（3）对每一个标注后的连通分量用半径为3的圆盘结构进行膨胀，将膨胀后的连通分量与候选区域的连通分量进行异或操作即可得到候选区域对应的邻域区域掩模图I3。

（4）将I2和I3分别覆盖到I1中，利用式（9）分别计算候选区域和邻域区域中每一个连通分量的平均灰度值L0和L1，利用式（10）等式部分计算它们之间的亮度差ε。

（5）利用式（6）和L0的值计算得到临界亮度差D(L)。

（6）通过式（10）判断ε 和D(L)之间的大小关系，若满足条件则将这一连通区域放到空白图像I0中，反之就将这一连通区域的灰度值置为0，最终得到的图像I0即为去除了伪渗出物区域的掩模图。

由图5所示效果图可知，提出的边缘感知模型能够有效筛选掉伪渗出物区域，图中框定了部分被筛除的伪渗出物区域。

图5 边缘感知模型效果对比

3.2 移除视盘

在经过边缘感知模型筛选后的图像中依然存在视盘结构，为了能得到最终精细渗出物区域的掩模图，本文采用文献[21]提到的方法实现对眼底图像中视盘结构的提取。由于在眼底图像中，视盘的对比度及亮度相对其他特征最为明显，而红色通道主要体现亮度信息，因此选取原图红色通道图像进行处理。首先采用投影法定位视盘，用Gabor 滤波提取视盘区域的血管，然后利用插值运算填充血管区域可以得到完整形态的视盘，最后采用CV水平集模型获得视盘轮廓，从而得到视盘区域的掩模图，效果图如图6所示。

图6 视盘掩模的提取

为保证视盘区域能够被完全移除，对上述掩模图用半径为3的圆盘结构进行膨胀操作，标记且记录掩模图中的连通区域，在经过边缘感知模型筛选后的图像中，对标记的连通区域中所有位置的像素点灰度值置为0，即可去除视盘结构，如图7（a）所示。

图7 最终检测结果

3.3 算法验证

本文采用的实验对象基于数据库IDRID[22]，该数据库中共包含81 张存在渗出物的图片，图像分辨率为4 288×2 848。该数据库专门用于糖尿病性视网膜病变和糖尿病性黄斑水肿的验证。将训练集图像与测试集图像混合，随机选择其中的61张作为训练集，剩余的20张作为测试集，将得出的结果与金标准进行比较。

为了验证本文算法的有效性，利用医学图像分割中广泛用到的四种评价指标：灵敏性（Sensitivity，SE），代表了算法能从图像中检测到病灶区域的能力，也称为召回率（Recall，R）；特异性（Specificity，SP），代表了算法能从图像中检测到正常区域的能力；阳性预测值（Positive Predictive Value，PPV），代表了算法检测出来的真阳性区域占整个阳性区域的比例，也称为精确率（Precision，P）；准确率（Accuracy，ACC），代表了算法检测到的所有正确区域在整图中所占比例。计算公式如下：

式中，TP 代表真阳性（True Positive），即被算法预测为正的正样本，也被称作判断为真的正确率；FP 代表假阳性（False Positive），被算法预测为正的负样本，也被称作误报率；FN 表示假阴性（False Negative），即被算法预测为负的正样本，也被称作漏报率；TN 表示真阴性（True Negative），被算法预测为负的负样本，也被称作判断为假的正确率。

一般而言，精确率P 和召回率R 同时越高越好，但某些情况下两者会出现矛盾，这时就需要将两者综合起来考虑，用到的评价指标被称为F-measure（也被称为F-Score），计算公式如下：

当参数α=1 时，就是最常见的F1，即：

由上式可知，F1综合了P 和R 的结果，其值能够反映实验方法的有效性。

4 实验结果与对比

本文实验在Windows 10、编程环境为MatlabR2014a、CPU主频为2.50 GHz及8 GB内存条件下进行。

4.1 FCM聚类的参数选择

为了确定在单特征图像（CLAHE 处理后的绿色通道图像Ig）和双特征图像（CLAHE 处理后的绿色通道图像Ig+阴影校正后的图像Isc）两种情况下聚类中心点个数c 值的最优值，表2给出了针对20张测试图像的量化比较。利用FCM聚类后的候选图与对应图像的金标准特征图计算得出P 和R，由于聚类后的候选图中含有大量的非病灶区，得到的P 和R 值大小具有很大差异，这里引入参数F1进行综合评价，最终的平均评价结果如表2所示。

表2 不同参数下聚类结果的F1 值 %

需要注意的是，由于上述实验的F1值是直接利用聚类候选图计算所得，并没有利用边缘感知模型筛除掉图中的非病灶区域，因此得出的F1值比较小。由表2可知，使用双特征图得到的聚类效果普遍比使用单特征图得到的聚类效果好，且当聚类中心点个数c=4 时，聚类效果达到最佳。

4.2 最终结果对比

为了检验所提方法的性能，用以上提到的四个评价指标分析，分别与动态阈值和数学形态学结合的方法[7]、形态学背景估计和SVM分类结合的方法[9]、决策树分类器分类的方法[12]、传统深度卷积网络的方法[13]相比，得到的效果图如图8所示，计算测试集图像各项评价指标的平均值，结果如表3所示。

表3 算法性能比较 %

图8 渗出物检测结果

图8是检测结果中比较具有代表性的图像，图像中的黄色标记物即为检测出来的渗出物区域。尽管在图像中存在程度不一的光照不均和对比度不足等问题，但从最终的检测结果来看，虽然几种对比方法都能将渗出物不同程度地检测出，但相对来看，本文提出的方法能够检测出一些比较精细的渗出物区域，体现出算法具有较高的准确度。

从表3可以看出，在敏感度方面，本文和文献[7]、文献[12]相比稍逊，主要原因是部分渗出物的形态及灰度不太明显，和周围区域不能形成符合人眼特性的灰度差，导致产生少量的漏检使得真阳性区域降低，假阴性区域增加，但其灵敏度明显优于其他文献，且满足英国糖尿病协会提出的灵敏度应该不小于80%的检测标准；在特异性方面，本文明显优于文献[12]略低于文献[7]；对于阳性预测值和准确率而言，本文优于其他算法，说明本文算法检测出来的真阳性区域占整个阳性区域的比例较高。

5 讨论

初始分割效果的好坏以及准确定位与否都将直接影响到最终渗出物区域的识别，由于渗出物在眼底图像中的图像特征具有一致性，而聚类算法能够根据这些相似特征对目标进行无监督的自动分割，因此本文利用FCM 聚类算法实现对候选病灶目标的提取，不仅克服了阈值选择的困难，还避免了对大部分渗出物的漏分割。利用经过CLAHE 处理后的绿色通道图像和阴影校正后的图像作为特征图像数据集，虽然可以提高对渗出物区域的检测精度，使候选渗出物区域能够最大化地包含真实病灶区域，但依然误分割了眼底图像中具有类似特征的伪渗出物（少量正常眼底特征和掩模边缘片段），由于这些伪渗出物区域和周围背景区域之间没有明显的灰度差异且其位置相对独立，利用基于判断灰度差的边缘感知模型可以很好地筛除这些伪渗出物区域。在之后，因视盘区域与渗出物区域亮度特性相似，经过边缘感知模型筛除一些伪渗出物后的图像中视盘区域仍然存在，若要得到关于真实渗出物区域的掩模图，需对视盘区域进行单独处理，本文用到文献[21]中提到的方法对视盘部分进行移除得到最终的渗出物区域。

在整个过程中，FCM聚类结果至关重要，若聚类结果过于泛化，边缘感知模型起到的作用不大；若聚类结果过于精细，则会导致检测到的渗出物区域不够完整，灵敏度大幅降低。虽然经过大量实验证明当选取经过CLAHE处理后的绿色通道图像和阴影校正后的图像作为特征图像数据集，且设置聚类中心个数为4 时，聚类出的图像效果能够达到最好，但对于一些密度比较稀疏，亮度不够明显的渗出物区域仍然检测不到，因此，在以后的研究中将尝试通过增加合适的预处理操作提高这些区域的亮度和对比度，减少漏检。

6 结论

本文提出一种结合模糊C-均值聚类和边缘感知模型的方法实现对渗出物的检测，首先用亮度均衡和对比度增强对原始图像进行预处理，然后用FCM 检测出候选渗出物区域后，利用边缘感知模型筛除一些伪渗出物区域，最后通过移除视盘区域得到真实渗出物区域。采用公开的数据库进行实验验证，说明本文算法能有效检测出渗出物区域，体现了较高的可行性和优越性。

致谢非常感谢广东省科技创新战略专项资金（2018FS05020102）的资助，向大力支持这项研究工作的广东顺德创新设计研究院表示衷心感谢！