
摘要
在本文中,我们将带有随机层的循环神经网络(Recurrent Neural Networks with Stochastic Layers)应用于声学新奇检测问题。这种网络在生成文本、音乐和语音方面处于前沿地位,通过将不确定性融入隐藏状态,能够学习复杂序列的分布。由于所学的分布可以用概率显式计算,因此我们可以评估某个观测值出现的可能性,并将低概率事件检测为新奇事件。该模型具有鲁棒性强、高度无监督、端到端的特点,并且需要最少的预处理、特征工程或超参数调整。实验结果表明,我们的模型在基准数据集上优于现有的最先进的声学新奇检测器。
代码仓库
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| acoustic-novelty-detection-on-a3lab-pascal | VRNN | F1: 93.6 |