
摘要
在语音对话系统中,对话状态跟踪器(DST)组件通过更新与当前用户轮次相关的每个槽位的值分布来跟踪对话的状态,利用迄今为止的交互信息。以往的许多研究依赖于建模对话的自然顺序,使用基于距离的偏移量作为时间的近似值。本文假设,利用轮次之间的实际时钟时间差对于更精细地控制对话场景至关重要。我们开发了一种新颖的方法,该方法根据实际时钟时间差应用一个{\it 时间掩码}(time mask),对相关槽位嵌入进行处理,并通过实验证明,我们的方法在内部基准数据集和DSTC2上均优于现有的基于距离偏移量的方法。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| video-salient-object-detection-on-mcl | TIMP | AVERAGE MAE: 0.113 MAX E-MEASURE: 0.760 S-Measure: 0.642 |
| video-salient-object-detection-on-segtrack-v2 | TIMP | AVERAGE MAE: 0.116 S-Measure: 0.644 max E-measure: 0.768 |