
摘要
本文提出了一种在长时序序列中查找与一组短时序序列相似片段的新方法。我们首次提出了一种无需通过计算查询样本的平均序列来进行搜索的算法。相反,该方法直接使用原始的查询样本,并同时利用所有样本进行匹配。所提出的基于动态时间规整(Dynamic Time Warping, DTW)的技术,特别适用于少样本示例查询(few-shot query-by-example)任务。我们在自然语言处理领域中的两个不同少样本问题上对该方法进行了评估,结果表明:在样本数量较少的情况下,该方法要么显著优于现有基线模型和先前方法,要么在性能上达到相当水平。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| semantic-retrieval-on-contract-discovery | DBTW, GPT-1 embeddings, fICA | Soft-F1: 0.51 |