3 个月前

LungAttn:基于双TQWT与三STFT谱图注意力机制的肺部声音分类

LungAttn:基于双TQWT与三STFT谱图注意力机制的肺部声音分类

摘要

目的:肺部听诊在肺部疾病的早期诊断中具有重要作用。本研究旨在开发一种自动化异常肺音检测方法,以减轻医生的工作负担。方法:我们提出了一种基于深度学习的新型架构——LungAttn,该架构在ResNet模块中引入增强型注意力卷积机制,以提升肺音分类的准确性。采用基于双可调Q因子小波变换与三重短时傅里叶变换的特征提取方法,生成多通道频谱图。同时,引入Mixup数据增强方法,对异常肺音样本进行扩充,以缓解数据集不平衡问题。主要结果:基于ICBHI 2017挑战赛数据集,我们实现了所提出的框架,并与当前最先进的方法进行对比。实验结果表明,LungAttn模型在该数据集上的灵敏度(Se)、特异性(Sp)和综合评分(Score)分别达到36.36%、71.44%和53.90%。相较于基于ICBHI 2017官方数据划分方法的最先进模型,本方法在综合评分上提升了1.69个百分点。意义:基于异常肺音不同振荡特性的多通道频谱图,为肺音信号提供了必要的特征信息。将注意力机制引入肺音分类任务中,已被证明具有显著有效性。所提出的LungAttn模型有望在临床实践中提升肺音分类的效率与准确性。

基准测试

基准方法指标
audio-classification-on-icbhi-respiratoryResNet-Att (scratch)
ICBHI Score: 53.90
Sensitivity: 36.36
Specificity: 71.44

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
LungAttn:基于双TQWT与三STFT谱图注意力机制的肺部声音分类 | 论文 | HyperAI超神经