APP下载

基于卷积神经网络的颅内出血亚类型研究分析

2021-04-04李秀芹张慢丽李琳

现代信息科技 2021年18期
关键词:卷积胶囊神经网络

李秀芹 张慢丽 李琳

摘  要:为辅助医师诊断患者是否患有颅内出血,迅速定位出血病灶的大体位置,提出以EfficientNet网络为基础的模型,使用群组归一化技术改进EfficientNet,并与胶囊网络相结合构建GECapsule模型,用于在计算机断层扫描(CT)中进行颅内出血亚类型分类。仿真实验结果表明,GECapsule模型的收敛速度比EfficientNet网络快,召回率和F1分数与EfficientNet相比分别提升了2.18%、1.24%。该模型是一种准确、高效的颅内出血亚类型分类模型,有助于医师减少初诊的误诊率,辅助医生做出恰当适宜的临床决策。

关键词:颅内出血亚类型分类;EfficientNet网络;胶囊网络;计算机断层扫描

中图分类号:TP18   文献标识码:A   文章编号:2096-4706(2021)18-0094-05

Abstract: In order to assist doctors in diagnosing patients with intracranial hemorrhage and quickly locate the general location of bleeding focus, this paper puts forward a model based on the EfficientNet network, improves EfficientNet by using Group Normalization technology, and constructs GECapsule model combined with capsule network, which is used to classify intracranial hemorrhage subtypes in computed tomography (CT). Simulation results show that the convergence speed of GECapsule model is faster than that of the EfficientNet network, and the recall rate and F1 score are increased by 2.18% and 1.24% respectively compared with EfficientNet. This model is an accurate and efficient classification model of intracranial hemorrhage subtypes, which is helpful for doctors to reduce the misdiagnosis rate of initial diagnosis and assist doctors in making appropriate clinical decisions.

Keywords: classification of intracranial hemorrhage subtypes; EfficientNet network; capsule network; computed tomography

0  引  言

顱内出血(Intracranial Hemorrhage, ICH)是一种相对常见的疾病,是由多种因素造成的,包括颅内动脉瘤破裂、颅内肿瘤、高血压、颅脑损伤等。根据颅内出血位置的不同,ICH可进一步分为五种亚类型[1]:脑实质出血(Intraparenchymal Hemorrhage, IPH)、脑室内出血(Intraventricular Hemorrhage, IVH)、蛛网膜下腔出血(Subarachnoid Hemorrhage, SAH)、硬膜外出血(Epidural Hemorrhage, EDH)和硬膜下出血(Subdural Hematoma, SDH)。不同的出血类型及程度决定了患者是否需要施行外科手术等干预措施[2,3]。颅内出血的亚类型和病灶区域的准确判断是临床医生用以确定采取何种临床治疗方案的关键。目前颅内CT的初步诊断多由低年资放射科医生提供,后期再由高年资放射科医生进行审核,多项研究显示,低年资放射科医生提供的初步诊断存在不同程度的误诊[4]。

近年来,部分学者尝试将人工智能算法应用于颅内出血亚类型分类。颅内出血亚类型分类用以判断CT图像中是否存在颅内出血情况并对其5种亚类型(IPH、IVH、EDH、SDH、SAH)进行分类[5]。颅内出血亚类型分类可以辅助放射科医生诊断患者是否患有颅内出血,并帮助医生迅速定位出血病灶的大体位置。在颅内出血亚类型分类算法的研究中,大多数研究采用卷积神经网络与循环神经网络相结合的网络结构,或是通过引入三维卷积神经网络来提高颅内出血亚类型分类的效果,然而,这些研究忽略了卷积神经网络在CT图像上的特征表达能力不够,通过结合循环神经网络或引入三维卷积神经网络的方式来提高颅内出血亚类型分类的效果,不仅对硬件基础设施要求高,而且会加剧计算资源的消耗。

针对以上问题,本文提出以下方法来应对这些挑战:本文算法建立在较大数据集样本基础上,基于性能优越的EfficientNet网络。为节省计算资源,加快网络收敛速度,提出使用群组归一化技术(Group Normalization, GN)对EfficientNet网络进行改进。针对卷积神经网络EfficientNet在CT图像上特征提取能力不够这一问题,将使用通过群组归一化技术改进后的EfficientNet网络与胶囊网络联合重构GECapsule模型。

1  相关理论基础

1.1  EfficientNet网络分析

EfficientNet网络利用复合系数统一缩放模型的深度、宽度和分辨率这三个维度,以实现卷积网络在准确率和效率上的优化。一个卷积网络的定义如式1所示。

其中,Fi表示对第i层的卷积运算,Li表示层Fi在第i个阶段被重复了Li次。<Hi,Wi,Ci>表示第i层输入的shape。EfficientNet将复合系数的确定转变为优化问题,如式2所示。

其中,w表示卷积核大小,决定了感受野大小;d表示网络的深度;r表示分辨率的大小。为了调节d、w、r,使得满足内存(Memory)和浮点数量(FLOPS)都小于阈值要求的目的,提出以下方法,如式3所示。

其中,α、β、γ作为常数可由小型的网格搜索来确定,为复合系数,用来控制模型的扩增。以上是EfficientNet的复合扩展方式。EfficientNet网络有8个系列,分别为EfficientNet-B0、EfficientNet-B1、EfficientNet-B2、EfficientNet-B3、EfficientNet-B4、EfficientNet-B5、EfficientNet-B6、EfficientNet-B7,其中后面7个系列都是在EfficientNet-B0基础上使用复合扩展法对网络进行扩展得到的。EfficientNet通过平衡网络宽度、网络深度和网络分辨率得到更高的精度及效率,且参数量和浮点数量都下降了一个数量级[6]。这正是颅内出血亚类型分类在临床试验中需要用到的,因此本文选择EfficientNet-B0网络作为基础模型,并在此基础上进行改进,以训练出性能更好的網络模型。

1.2  胶囊网络原理分析

与卷积神经网络相比,胶囊网络是一种向量神经网络,它通过向量计算进行误差反馈,并用胶囊代替了池化操作,有效地减少了信息的损失[7]。其优势在于不仅能够识别图中所包含的目标特征,而且能够识别出目标的位置姿态信息。胶囊网络中的动态路由算法迭代过程为:假设Capsule的输入特征分别为u1,u2,…,un,下一层的特征向量是v1,v2,…,vk,Wj是变换矩阵。动态路由算法如式4所示。

其中,squash是激活函数,如式5所示,我们使用squash激活函数对特征向量做一个压缩。

2  基于改进EfficientNet网络重构胶囊网络的颅内出血亚类型分类

2.1  数据分析与预处理

本实验使用的数据集来自北美放射学会组织发布的急性颅内出血检测比赛中的训练数据。所用的实验平台为tensorflow。在训练中,网络使用Adam优化器,学习率设置为0.000 125,随机梯度下降的批量大小设置为32。由于硬脑膜外出血类型在总数据集中的数量最少,故对其进行过采样。对于每一张CT扫描切片,我们使用脑窗(窗位=40,窗宽=80)、硬脑膜下窗(窗位=80,窗宽=200)和骨窗(窗位=40,窗宽=380)并将它们拼接成输入图像的三个通道输入网络中[8]。为评价模型在该数据集上的分类性能,实验中采用分类任务中常见的几个性能指标,包括准确率、精准度、敏感性、F1分数和曲线下面积(AUC)[9]。

2.2  改进EfficientNet重构胶囊网络的模型结构

本文选择的卷积神经网络是当前性能优越的EfficientNet,之所以选择该网络是因为其具有更强的表征能力[10],适应不同的计算资源。在实验中先搭建EfficientNetB0网络,使用预训练的imagenet权重。为防止过拟合,在EfficientNetB0输出层之前添加一个Droupout层。EfficientNetB0网络结构如表1所示。

目前主流的卷积神经网络都会采用批量归一化(Batch Normalization, BN)来解决训练过程中,中间层数据分布发生改变的问题,EfficientNet网络也是如此。BN在训练过程中严重依赖批次(Batch Size),如果批次很小,计算出来的均值和方差不足以代表整个数据的分布,往往会恶化网络性能,批次很大时,会超出内存容量,耗费更多的计算资源。而GN的优点是不受批次的影响,当批次取较小值时,GN的效果会比BN好。基于此,为加快网络收敛速度,节省计算资源,文中提出使用GN层改进EfficientNet网络。针对EfficientNet网络在CT图像上特征提取能力不足,会在池化层丢失大量信息、降低空间分辨率这一问题,引入胶囊网络。通过胶囊网络,详细的姿态信息(如精确的位置、大小等)被保存,使得模型能够从输入样本中提取更精细的图像特征,提高模型在CT图像上的特征表达能力。综上,本文提出使用GN层改进EfficientNet并结合胶囊网络构建了GECapsule模型,用于准确地进行颅内出血亚类型分类,GECapsule模型结构如图1所示。

其中,GECapsule模型结构中MBConv块的内部结构如图2所示。

相较于原始EfficientNet网络,GECapsule网络参数变化不大。其中,EfficientNet网络总参数和参与训练的参数分别为4 057 250和4 015 234,GECapsule网络总参数和参与训练的参数分别为4 483 996和4 441 980。

2.3  实验结果分析

为了验证本文提出的GECapsule模型在颅内出血亚类型分类上性能更好,将GECapsule模型与EfficientNet网络进行了仿真实验对比。

如图3所示,从EfficientNet网络和GECapsule模型的损失函数值对比图中可以看出,GECapsule模型的收敛速度比EfficientNet网络的收敛速度快。

EfficientNet网络和GECapsule模型在颅内出血亚类型分类任务中的准确率在训练集和测试集上的结果对比如图4所示,可知GECapsule模型的准确率要高于EfficientNet网络的准确率。

EfficientNet网络和GECapsule模型在颅内出血亚类型分类仿真实验中召回率的对比如图5所示,从图中可以看出,GECapsule模型在颅内出血亚类型分类任务中的召回率明显高于EFFICIENT网络。EfficientNet网络和GECapsule模型在颅内出血亚类型分类中的评价指标F1分数对比如图6所示,可知GECapsule模型的F1分数与EfficientNet网络相比,前者要高于后者。

EfficientNet网絡和GECapsule模型在颅内出血亚类型分类仿真实验中精准率的对比如图7所示,曲线下面积结果对比如图8所示,可知精准率和曲线下面积这两个评价指标在训练集和测试集上的结果大致相同。

为了更加清晰地对比EfficientNet网络和GECapsule模型的性能,接下来以表格的形式展示两者在颅内出血亚类型分类上的实验结果。实验结果中各评价指标的值取最后三次实验结果的均值。实验数据表明,GECapsule模型的性能比EfficientNet网络的性能优越,具体表现为在其他评价指标结果大致相同的前提下,GECapsule模型的召回率比EfficientNet网络提高了2.18%,F1分数提高了1.24%。颅内出血亚类型分类的实验结果如表2所示。

考虑到本实验使用的数据集正负样本比例不均衡,所以实验结果应更为关注精准率与召回率这两个指标。F1分数同时兼顾了分类模型的精准率和召回率。GECapsule模型的F1分数与EfficientNet网络相比提高了1.24%,故在颅内出血亚类型分类任务上GECapsule模型比EfficientNet网络表现更好,性能更优越。

2.4  与其他方法对比

为展示GECapsule模型的优越性,将GECapsule模型与DenseNet121网络进行对比,DenseNet是一种常用的卷积神经网络,多次被用于颅内出血亚类型分类任务中,因此可以作为一种基准模型。DenseNet121网络的训练参数与GECapsule模型的训练方法相同,且使用相同的数据集进行实验。已知DenseNet网络的总参数是7 043 654,可训练参数是6 960 006,比GECapsule的总参数和训练参数分别多2 986 404、2 944 772。

DenseNet和GECapsule在颅内出血亚类型分类上的实验结果如表3所示,表中各评价指标的值取最后三次实验结果的均值。由表3可知,GECapsule模型的F1分数比DenseNet网络提高了3.15%,GECapsule模型的其他各项指标值比DenseNet网络也都略有提高。因此,在颅内出血亚类型分类上本文提出的GECapsule比DenseNet更具优势。

3  结  论

本文提出了一种建立在较大数据集样本基础上、用于颅内出血亚类型分类的GECapsule模型。该模型在颅内出血亚类型分类任务上收敛速度快,泛化能力强,有望应用于临床,帮助医生提高工作效率,降低误诊率。本研究也有一定的缺陷和不足。实验中使用的数据集正负样本比例是不平衡的,后续将在平衡正负样本比例的基础上展开实验,以探究能否进一步提高颅内出血亚类型分类的精度。

参考文献:

[1] TAYLOR C A,BELL J M,BREIDING M J. et al. Traumatic Brain Injury-Related Emergency Department Visits, Hospitalizations, and Deaths - United States, 2007 and 2013 [J].MMWR.Surveillance summaries: Morbidity and mortality weekly report. Surveillance summaries/CDC,2017,66(9):1-16.

[2] 常健博,王任直,冯铭.人工智能在颅内出血诊断与治疗中的应用 [J].中国现代神经疾病杂志,2019,19(9):622-626.

[3] 李娟,汤翔宇,沈逸,等.基于卷积神经网络的深度学习算法对颅内出血的类型识别及血肿分割一致性的研究 [J].放射学实践,2021,36(1):7-12.

[4] 石立达.基于CT影像的颅内出血亚类型分类及分割算法的研究 [D].吉林:吉林大学,2021.

[5] 李代远.深度卷积信念网络在颅内CT图像分类中的应用 [D].长沙:湖南师范大学,2017.

[6] 叶紫璇,肖满生,肖哲.基于EfficientNet模型的多特征融合肺癌病理图像分型 [J].湖南工业大学学报,2021,35(2):51-57.

[7] 邱存月.改进胶囊网络优化分层卷积的亚健康识别算法研究 [D].沈阳:辽宁大学,2020.

[8] 陈铭林.基于深度学习的颅内出血CT影像分析 [D].深圳:中国科学院大学(中国科学院深圳先进技术研究院),2020.

[9] 张鹏,徐曾春,胡平.融合密集连接与注意机制的颅内出血分割方法 [J].小型微型计算机系统,2021,42(7):1458-1463.

[10] 张嘉颖.基于EfficientNet的皮肤癌识别与分类 [J].现代信息科技,2021,5(9):13-15.

作者简介:李秀芹(1967—),女,汉族,河南漯河人,教授,博士,研究方向:计算机网络、数据库与信息处理;张慢丽(1994—),女,汉族,河南周口人,硕士研究生在读,研究方向:数据挖掘;李琳(1995—),女,汉族,河南永城人,硕士研究生在读,研究方向:数据挖掘。

猜你喜欢

卷积胶囊神经网络
基于全卷积神经网络的猪背膘厚快速准确测定
基于人工智能LSTM循环神经网络的学习成绩预测
基于图像处理与卷积神经网络的零件识别
MIV-PSO-BP神经网络用户热负荷预测
基于深度卷积网络与空洞卷积融合的人群计数
胶囊要用凉开水服
三次样条和二次删除相辅助的WASD神经网络与日本人口预测
卷积神经网络概述
我有一颗神奇胶囊
服用胶囊的小细节