3 个月前

GTM-UVigo 系统在 MediaEval 2015 语音查询示例搜索任务中的应用

GTM-UVigo 系统在 MediaEval 2015 语音查询示例搜索任务中的应用

摘要

本文介绍了GTM-UVigo团队在MediaEval 2015语音查询示例搜索任务(QUESST)中所开发的系统。该系统由11个基于动态时间规整(Dynamic Time Warping, DTW)的模块融合而成,采用音素后验图(phoneme posteriorgrams)作为语音表示。其中,主系统提出了一种方法,用于在每个音素解码器中选择最相关的语音单元,从而显著提升了搜索结果的性能。

基准测试

基准方法指标
keyword-spotting-on-quesstGTM-UVigo Contrastive (eval)
Cnxe: 0.999
MinCnxe: 0.923
lowerbound : 0.633
keyword-spotting-on-quesstGTM-UVigo Contrastive (dev)
Cnxe: 0.998
MinCnxe: 0.918
lowerbound : 0.635
keyword-spotting-on-quesstGTM-UVigo Primary late submission (eval)
Cnxe: 0.871
MinCnxe: 0.838
lowerbound : 0.592
keyword-spotting-on-quesstGTM-UVigo Contrastive late submission (dev)
Cnxe: 0.907
MinCnxe: 0.864
lowerbound : 0.618
keyword-spotting-on-quesstGTM-UVigo Contrastive late submission (eval)
Cnxe: 0.989
MinCnxe: 0.852
lowerbound : 0.613
keyword-spotting-on-quesstGTM-UVigo Primary (eval)
Cnxe: 0.919
MinCnxe: 0.905
lowerbound : 0.629
keyword-spotting-on-quesstGTM-UVigo Primary (dev)
Cnxe: 0.917
MinCnxe: 0.905
lowerbound : 0.627
keyword-spotting-on-quesstGTM-UVigo Primary late submission (dev)
Cnxe: 0.875
MinCnxe: 0.847
lowerbound : 0.593

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
GTM-UVigo 系统在 MediaEval 2015 语音查询示例搜索任务中的应用 | 论文 | HyperAI超神经