3 个月前

基于LSTM循环神经网络的非线性预测在声学新奇性检测中的应用

基于LSTM循环神经网络的非线性预测在声学新奇性检测中的应用

摘要

声学新奇检测旨在识别与系统训练所用参考/正常数据存在差异的异常或新颖声学信号。本文提出一种基于非线性预测去噪自编码器的新方法。在该方法中,利用长短期记忆(LSTM)循环去噪自编码器,从前序帧预测下一短时帧的听觉谱特征,从而构建一个有效的音频生成模型。通过自编码器输入与输出之间的重构误差作为激活信号,实现对新奇事件的检测。自编码器在包含典型居家场景(如交谈、看电视、玩耍和进食)录音的公开数据库上进行训练。评估在超过260种不同异常事件上进行。实验结果与当前最先进的方法进行对比,表明本方法显著优于现有技术,最高可达到94.4%的F-Measure。

基准测试

基准方法指标
acoustic-novelty-detection-on-a3lab-pascalNP-BLSTM-DAE
F1: 94.4

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于LSTM循环神经网络的非线性预测在声学新奇性检测中的应用 | 论文 | HyperAI超神经