{Haizhou LiEng Siong ChngBin MaSu Jun LeowLei WangHang LvJIA YUHongjie ChenCheung-Chi LeungLei XieXiong XiaoHaiHua XuPeng Yang}
摘要
本文介绍了NNI(NWPU-NTU-I2R)团队在Mediaeval 2014评测中针对QUESST任务所提出的系统方案。为解决该问题,我们采用了基于动态时间规整(DTW)与符号搜索(SS)的两种方法。DTW系统通过子序列DTW算法与后验概率表示进行模板匹配;符号搜索则在电话识别器生成的音素序列上进行。针对符号搜索与DTW搜索,均采用了部分序列匹配策略,以降低漏检率,尤其针对查询类型2和类型3。在融合9个DTW系统、7个符号搜索系统以及查询长度的辅助信息后,所有查询类型的综合实际归一化交叉熵(actCnxe)达到0.6023;对于复杂查询类型3,取得了0.7252的actCnxe性能。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| keyword-spotting-on-quesst | NNI DTW(All Queries) | ATWV: 0.2918 Cnxe: 0.6925 MTWV: 0.2974 MinCnxe: 0.6816 |
| keyword-spotting-on-quesst | NNI non-filtered(for the development set) | ATWV: 0.0768 Cnxe: 6.0905 MTWV: 0.0767 MinCnxe: 0.9571 |
| keyword-spotting-on-quesst | NNI Choi(for the development set) | ATWV: 0.0692 Cnxe: 5.8940 MTWV: 0.0692 MinCnxe: 0.9595 |
| keyword-spotting-on-quesst | NNI Symbolic(All Queries) | ATWV: 0.2696 Cnxe: 0.7322 MTWV: 0.2717 MinCnxe: 0.7293 |