摘要
目的:肺部听诊在肺部疾病的早期诊断中具有重要作用。本研究旨在开发一种自动化异常肺音检测方法,以减轻医生的工作负担。方法:我们提出了一种基于深度学习的新型架构——LungAttn,该架构在ResNet模块中引入增强型注意力卷积机制,以提升肺音分类的准确性。采用基于双可调Q因子小波变换与三重短时傅里叶变换的特征提取方法,生成多通道频谱图。同时,引入Mixup数据增强方法,对异常肺音样本进行扩充,以缓解数据集不平衡问题。主要结果:基于ICBHI 2017挑战赛数据集,我们实现了所提出的框架,并与当前最先进的方法进行对比。实验结果表明,LungAttn模型在该数据集上的灵敏度(Se)、特异性(Sp)和综合评分(Score)分别达到36.36%、71.44%和53.90%。相较于基于ICBHI 2017官方数据划分方法的最先进模型,本方法在综合评分上提升了1.69个百分点。意义:基于异常肺音不同振荡特性的多通道频谱图,为肺音信号提供了必要的特征信息。将注意力机制引入肺音分类任务中,已被证明具有显著有效性。所提出的LungAttn模型有望在临床实践中提升肺音分类的效率与准确性。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| audio-classification-on-icbhi-respiratory | ResNet-Att (scratch) | ICBHI Score: 53.90 Sensitivity: 36.36 Specificity: 71.44 |