APP下载

鼾声检测研究综述

2020-07-20孙井鹏胡晰远彭思龙

世界睡眠医学杂志 2020年3期
关键词:鼾声文献能量

孙井鹏 胡晰远 彭思龙

摘要 鼾声检测任务近年来取得了较大的发展,出现了许多相应的检测方法,这些方法也有着较为明确的框架与发展趋势。因此,本文就鼾声检测的研究现状进行总结,并给出该方向发展前景的讨论,以期让大家在了解其历史发展的基础上,跟进最新进展,对未来的发展方向有更加深入的认识。

关键词 鼾声检测;阻塞型睡眠呼吸暂停综合征;研究综述

Abstract The snore detection task has made great progress in recent years,and many approaches have been proposed.These methods have a relatively clear framework and development trend.Therefore,this article summarizes the current research situation of snore detection and discusses the development of this field with the hope that everyone could follow the latest situation on the basis of understanding its historical development and have a deeper understanding of the future development of snore detection.

Keywords Snore detection;OSAHS;Review

中图分类号:R714.253;R765文献标识码:Adoi:10.3969/j.issn.2095-7130.2020.03.075

1 鼾声检测研究背景与意义

阻塞性睡眠呼吸暂停低通气综合征(OSAHS)作为最常见的睡眠呼吸疾病之一,严重影响着人类的睡眠质量[1-2]及健康状况,世界上約有5%的人患有OSAHS,如果得不到及时治疗,OSAHS将会诱发高血压、冠心病、糖尿病、心力衰竭,甚至猝死等症状。目前临床上诊断OSAHS的“金标准”是睡眠多导监测(PSG),其是通过记录患者一夜睡眠期间的若干生理信号(如脑电信号、心电信号、肌电信号、眼电信号、血氧饱和度和鼾声等),然后通过睡眠技师人工分析得到关于OSAHS的报告。这一过程需要耗费大量的医护人力和医疗设备资源,导致很多OSAHS患者不能得到及时治疗。鼾声作为OSAHS早期特征,也是最典型的症状之一,近年来引起了研究人员的广泛关注。一方面,鼾声与OSAHA有着紧密的联系:OSAHS表现为睡眠中塌陷的上气道反复出现闭合引起呼吸暂停或通气不足,并伴有打鼾、血氧饱和度下降以及呼吸结构紊乱等症状。在此过程中,随着塌陷程度的增加,上气道内的压力也随之增加,导致气流速度加快并引起上气道内某些组织的振动从而产生了鼾声。鉴于此,如果上气道的状态(如振动位置、塌陷程度)不同,那么根据鼾声产生的过程,不同状态下产生的鼾声也应该不同,即鼾声能够反映上气道的状态。另一方面,鼾声数据的采集较之PSG也更加方便。有研究表明,鼾声中包含着OSAHS的信息,因此,近年来有大量的基于鼾声的OSAHS研究。但是,这些研究大部分都集中在鼾声信号的分析上,而在鼾声信号的检测方面则比较少。大多数鼾声分析的研究,其鼾声数据都是基于人工截取标注的,手动标注数据需要耗费大量的时间与人力,不仅精度低(鼾声的起止位置不精确)而且效率低,从鼾声领域的研究来看,也不便于该领域的快速发展,因此鼾声检测任务是鼾声分析领域至关重要并亟待解决的问题。

2 鼾声检测研究现状

在鼾声检测的研究中,相关方法可以分为两大类:1)多阶段法;2)单阶段法。两者的区别在于:前者需要经过多个阶段的分析处理才能实现鼾声的检测,而后者是一种一步到位的检测方法。

2.1 多阶段法

多阶段的方法把鼾声检测任务分为多个过程,该类方法大概可归纳为以下3个阶段:1)有声段检测;2)特征提取;3)鼾声检测。

2.1.1 有声段检测 通过观察音频信号的时域波形我们能够发现,有声音的部分与背景部分存在明显不同,如波形分布不同、幅度变化特点不同。基于此文献[3-4]提出一种基于局部窗口的声音检测方法,该种检测方法通过统计落入该窗口中的观测值的个数来分析是否到达声音事件的端点。考虑到背景声音的方差较之有声段的方差更为稳定,文献[5]提出一种更为简便的基于方差变化的有声段检测方法,但是该方法在背景变化较大的情况下稳定性较差。更为常用且更加稳定的方法是基于短时能量阈值的方法[6-13],有声段的中间部分能量通常会大于背景声,不过其端点部分很可能由于能量较小而被背景声音淹没,为了解决这个问题,通常将单位时间内通过零点的次数(过零率)与短时能量结合[6,12-13],因为过零率与能量无关,通常背景声的过零率小于有声段,二者结合会取得更准确的结果。除时域外,文献[14]通过双阈值的方法对音频的功率谱进行筛选达到有声段检测的目的。

2.1.2 特征提取 早期在特征提取阶段研究人员使用的都是较为简单的特征如能量[4],基频[12],自相关系数[13]以及时域或谱域的特征[5]。这些特征较为简单,并没有考虑到鼾声与其他声音的区别,所以检测效果不好[3-4,6]。根据鼾声的子带能量分布特征,将鼾声的频谱分为若干子频带,计算每个频带的能量以表征声音事件的能量分布特征,这种做法较之简单的使用频率特征有稍微的改善,但是,值得注意的是其使用的子带能量分布特征并不能很好地表征人耳听觉特性,也没有明显的声学意义。为了模仿人耳处理声音的过程,文献[11]通过对声音事件进行声音图像建模(AIM)以期模仿声音从外耳到大脑的听觉通路,AIM主要包含5个步骤,分别为:类耳蜗处理(Pre-cochlear Processing)、底膜运动处理(Basilar MemBrane Motion)、神经激活模式(Neural Activity Pattern)、脉冲识别(Strobe Identification)和稳态听觉成像(Stabilized Auditory Image),虽然该方法有一定的仿生学意义,但是过程复杂,在鼾声检测领域并没有得到广泛的应用。实际上目前在表征人耳听觉方面使用较多并在语音识别中表现出明显优势的声学特征是梅尔频率倒谱系数(MFCC),近年来许多鼾声检测的方法也将MFCC作为主要声学特征之一[7-10,14-15],其是通过将音频的频谱通过一组能够反映人耳听觉特性的非线性分布的梅尔频率滤波器组得到的。它的第一个系数反应音频的能量大小,为了使特征独立于能量的变化可以将第一个系数删除。另外,为了反应音频的动态特性,通常将MFCC的一阶与二阶差分与其结合在一起使用。

2.1.3 鼾声检测 自进入21世纪以来,鼾声检测方向的研究较之以前出现了小幅增长,涌现了一批检测算法,这些算法可分为有监督和无监督两类。有监督算法中[5-17],早期,文献[15]将鼾声分为起始、中间与结束3个状态,试图通过对鼾声事件使用隐马尔科夫模型进行建模的方式实现检测的目的,但是由于鼾声的多样性,该类建模方法并没能取得较好的应用。更多的研究使用的是基于分类的方法,K-近邻(KNN)算法[9]、支持向量机(SVM)[17]、高斯混合模型(GMM)[7]、线性回归[6]、逻辑斯蒂回归[11]等分类算法均有应用,除了单独的分类器之外,文献[8]使用集合多个分类器的集成学习分类器Adaboost应用在鼾声检测的任务中。无监督算法主要是以聚类算法为主[3-4],分别通过Fuzzy c-means与k-means 2种聚类算法来实现鼾声检测。然而基于上述聚类算法和分类算法的鼾声检测算法,一定程度上实现了相关功能,但是效果不尽如人意,究其原因主要是因为鼾声信号的高度非线性与多样性,且大多数鼾声信噪比较低,这也给检测任务带来了一定的难度,而近年来随着大数据的兴起与高性能计算的普及,神经网络强大的数据表示能力得以展现,在解决非线性表示问题上,在计算机视觉、自然语言处理、语音识别等领域表现出了卓越的性能,并获得广泛关注。文献[10]构建了人工神经网络模型(ANN)用于鼾声检测,取得了不错的效果,但是由于他们使用的只是层数较少的普通的神经网络模型,在表示时间序列上优势并不明显,为了克服这个问题,文献[14]利用循环神经网络(RNN)较好地表达了鼾声的时间序列特征,取得了较高的准确率。

2.2 单阶段法 目前大部分的研究基本上都是多阶段的方法,但这种做法通常会面临以下问题。首先,在有声段检测阶段,无论是基于时域还是频域特征,均是基于阈值的,而这些阈值是超参数很难选择。一般的解决方式是采用自适应的方法选择阈值,如根据整个训练集的数据分布选择阈值,也只是杯水车薪,其泛化能力较差。其次,在特征提取阶段,我们注意到,研究人员试图从鼾声的产生端、人耳的接收端来模拟人耳对鼾声的感知特性,共振峰、梅尔频率倒谱系数这些都只是基于我们的先验知识而人工设计的特征,至于该特征是否真的能像预期的一样反映人类的听觉系统特性,还需要进一步探索,而且目前使用较多的特征也比较单一。最后,目前大部分的鼾声检测算法,其实是在选定类型下的鼾声分类算法,这些研究只考虑了睡眠期间的除鼾声之外的部分其他声音(如咳嗽、说话、呼吸等),但在实际情况下,睡眠期间还会发生许多其他类型的声音(如敲门声、动物叫声、汽车声等),因此这些方法均不能很好地适用于实际情况。因此,我们需要一种更加鲁棒,独立于人工特征,更适用于实际情况的鼾声检测算法。有文献[18]在这方面做了初步的尝试,提出了一种基于深度学习的端到端的鼾声检测模型,该模型以一维卷积神经网络为基础,以原始录音数据为输入,直接输出鼾声检测结果,但是由于该模型使用的是卷积网络,在表达时间序列信息上有所不足,其性能还有待进一步改善。

3 发展前景

纵观近20多年鼾声检测领域的发展可以看到,以往基于传统机器学习的方法正在慢慢被深度学习所替代,多阶段算法的主导地位也出现了向单阶段方法过渡的迹象,相信随着近年来海量数据的出现,计算力的大幅度提升,单阶段检测方法将成为未来的趋势。如何做到快速、准确地检测到睡眠期间的鼾声,将是未来睡眠相关研究领域内一个必须要深度探讨的问题。

参考文献

[1]Macarthur K E,Ryan C M,Bradley T D,et al.Differential Effect of Snoring and Obstructive Sleep Apnea on Sleep Structure and Sleepiness[M]//C77.PREDICTORS OF SLEEP DISORDERED BREATHING AND RESPONSE TO TREATMENT.American Thoracic Society,2018:A5899-A5899.

[2]胡雪君,康健,王瑋,等.持续正压通气对阻塞性睡眠呼吸暂停患者睡眠质量改善作用[J].中国医科大学学报,2001,30(3):44-46.

[3]Azarbarzin A,Moussavi Z M K.Automatic and unsupervised snore sound extraction from respiratory sound signals[J].IEEE Transactions on Biomedical Engineering,2010,58(5):1156-1162.

[4]Azarbarzin A,Moussavi Z.Unsupervised classification of respiratory sound signal into snore/no-snore classes[C]//2010 Annual International Conference of the IEEE Engineering in Medicine and Biology.IEEE,2010:3666-3669.

[5]Jané R,Solà-Soler J,Fiz J A,et al.Automatic detection of snoring signals:validation with simple snorers and OSAS patients[C]//Proceedings of the 22nd Annual International Conference of the IEEE Engineering in Medicine and Biology Society(Cat.No.00CH37143).IEEE,2000,4:3129-3131.

[6]Cavusoglu M,Kamasak M,Erogul O,et al.An efficient method for snore/nonsnore classification of sleep sounds[J].Physiological measurement,2007,28(8):841.

[7]Dafna E,Tarasiuk A,Zigel Y.Automatic detection of snoring events using Gaussian mixture models[C]//Seventh International Workshop on Models and Analysis of Vocal Emissions for Biomedical Applications.2011.

[8]Dafna E,Tarasiuk A,Zigel Y.Automatic detection of whole night snoring events using non-contact microphone[J].PloS one,2013,8(12):e84139.

[9]Qian K,Xu Z,Xu H,et al.Automatic detection,segmentation and classification of snore related signals from overnight audio recording[J].IET Signal Processing,2015,9(1):21-29.

[10]Swarnkar V R,Abeyratne U R,Sharan R V.Automatic picking of snore events from overnight breath sound recordings[C]//2017 39th Annual International Conference of the IEEE Engineering in Medicine and Biology Society(EMBC).IEEE,2017:2822-2825.

[11]Nonaka R,Emoto T,Abeyratne U R,et al.Automatic snore sound extraction from sleep sound recordings via auditory image modeling[J].Biomedical Signal Processing and Control,2016,27:7-14.

[12]Abeyratne U R,Wakwella A S,Hukins C.Pitch jump probability measures for the analysis of snoring sounds in apnea[J].Physiological measurement,2005,26(5):779.

[13]Karunajeewa A S,Abeyratne U R,Hukins C.Silence-breathing-snore classification from snore-related sounds[J].Physiological Measurement,2008,29(2):227.

[14]Arsenali B,van Dijk J,Ouweltjes O,et al.Recurrent Neural Network for Classification of Snoring and Non-Snoring Sound Events[C]//2018 40th Annual International Conference of the IEEE Engineering in Medicine and Biology Society(EMBC).IEEE,2018:328-331.

[15]Duckitt W D,Tuomi S K,Niesler T R.Automatic detection,segmentation and assessment of snoring from ambient acoustic data[J].Physiological measurement,2006,27(10):1047.

[16]Perez-Macias J M,Tenhunen M,Vrri A,et al.Detection of snores using source separation on an Emfit signal[J].IEEE journal of biomedical and health informatics,2017,22(4):1157-1167.

[17]Christoph Janott,Christian Rohrmeier,Maximilian Schmitt,et al.Snoring-an acoustic definition[C]//2019 41st Annual International Conference of the IEEE Engineering in Medicine and Biology Society(EMBC).IEEE,2019:3653-3657.

[18]Sun J,Hu X,Zhao Y,et al.SnoreNet:Detecting Snore Events from Raw Sound Recordings[C]//2019 41st Annual International Conference of the IEEE Engineering in Medicine and Biology Society(EMBC).IEEE,2019:4977-4981.

猜你喜欢

鼾声文献能量
Hostile takeovers in China and Japan
正能量
爸爸的鼾声
Cultural and Religious Context of the Two Ancient Egyptian Stelae An Opening Paragraph
The Application of the Situational Teaching Method in English Classroom Teaching at Vocational Colleges
The Role and Significant of Professional Ethics in Accounting and Auditing
爸爸的鼾声
父亲的鼾声
正能量描绘词
正能量描绘词