
摘要
产品属性对于电子商务平台至关重要,支持诸如搜索、推荐和问答等应用。产品属性和值识别(PAVI)任务涉及从产品信息中识别出属性及其对应的值。在本文中,我们将PAVI视为一个生成任务,并据我们所知,提供了迄今为止最全面的PAVI评估。我们基于三个数据集比较了三种不同的属性-值生成(AVG)策略,这些策略都是通过对编码器-解码器模型进行微调实现的。实验结果表明,计算效率较高的端到端AVG方法优于其他策略。然而,根据模型大小和底层语言模型的不同,效果也有所差异。所有实验的代码均可在以下链接获取:https://github.com/kassemsabeh/pavi-avg
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| attribute-mining-on-ae-110k | T5 Large - End2End | F1-score: 84.29 |
| attribute-mining-on-mave | T5 Large - End2End | F1-score: 95.19 |
| attribute-mining-on-oa-mine-annotations | T5 Large - End2End | F1-score: 86.28 |