摘要
在自动检测异常肺部声音的任务中,由于呼吸音易受多种噪声干扰(如心音、运动伪影及环境音频等),且不同类别之间的差异较为细微,因此该任务极具挑战性。本文提出了一种新型异常肺音分类模型——LungRN+NL,相较于我们先前的工作以及当前的最先进模型,该模型表现出显著的性能提升。该模型在ResNet架构中引入了非局部模块(non-local block),以增强对长距离依赖关系的建模能力。为缓解数据类别不平衡问题并提升模型的鲁棒性,本文还采用了Mixup数据增强方法对训练集进行扩充。所提出的模型基于ICBHI 2017挑战赛官方数据集及其评估标准进行了实现与对比实验。实验结果表明,LungRN+NL在性能评分上达到了52.26%,相比现有最先进模型提升了2.1%至12.7%。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| audio-classification-on-icbhi-respiratory | ResNet (scratch) | ICBHI Score: 52.26 Sensitivity: 41.32 Specificity: 63.20 |