摘要
声学新奇检测旨在识别与系统训练所用参考/正常数据存在差异的异常或新颖声学信号。本文提出一种基于非线性预测去噪自编码器的新方法。在该方法中,利用长短期记忆(LSTM)循环去噪自编码器,从前序帧预测下一短时帧的听觉谱特征,从而构建一个有效的音频生成模型。通过自编码器输入与输出之间的重构误差作为激活信号,实现对新奇事件的检测。自编码器在包含典型居家场景(如交谈、看电视、玩耍和进食)录音的公开数据库上进行训练。评估在超过260种不同异常事件上进行。实验结果与当前最先进的方法进行对比,表明本方法显著优于现有技术,最高可达到94.4%的F-Measure。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| acoustic-novelty-detection-on-a3lab-pascal | NP-BLSTM-DAE | F1: 94.4 |