3 个月前

TUKE系统用于MediaEval 2014 QUESST

TUKE系统用于MediaEval 2014 QUESST

摘要

本文介绍了斯洛伐克科希策技术大学(TUKE)为语音查询任务(QUESST)提出的两种查询-by-例(Query-by-Example, QbE)检索系统方法。本研究的主要目标是构建一种QbE系统,该系统能够在不依赖任何外部语音资源的情况下,实现对所有给定查询的准确检索。为此,我们提出了一种基于后验图(posteriorgram)的关键词匹配系统,并引入了一种新型加权快速序列动态时间规整算法(Weighted Fast Sequential DTW, WFS-DTW),用于在特定语音语句文件中检测每个查询的出现位置。该系统采用两种基于高斯混合模型(GMM)的声学单元建模方法。第一种方法称为“低资源方法”(low-resource approach),利用语言相关的音素解码器,将查询和语音语句转换为后验图。第二种方法称为“零资源方法”(zero-resource approach),仅依赖所提供的语音语句文件,通过无监督的语音分割与聚类技术实现建模,无需任何外部语言或语音资源。

基准测试

基准方法指标
keyword-spotting-on-quesstTUKE p-low late submission (for the development set)
ATWV: 0.191
Cnxe: 0.948
MTWV: 0.191
MinCnxe: 0.854
keyword-spotting-on-quesstTUKE g-zero(for the development set)
ATWV: 0.091
Cnxe: 0.974
MTWV: 0.091
MinCnxe: 0.934
keyword-spotting-on-quesstTUKE g-zero late submission(for the development set)
ATWV: 0.106
Cnxe: 0.971
MTWV: 0.107
MinCnxe: 0.922
keyword-spotting-on-quesstTUKE p-low(for the development set)
ATWV: 0.161
Cnxe: 0.960
MTWV: 0.162
MinCnxe: 0.892

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
TUKE系统用于MediaEval 2014 QUESST | 论文 | HyperAI超神经