4 个月前

ExtractGPT:探索大型语言模型在产品属性值提取中的潜力

ExtractGPT:探索大型语言模型在产品属性值提取中的潜力

摘要

电子商务平台需要以属性值对的形式提供结构化的产品数据,以便实现诸如多维度产品搜索或基于属性的产品比较等功能。然而,供应商通常提供的产品描述是非结构化的,这需要从这些文本中提取属性值对。基于BERT的提取方法需要大量的特定任务训练数据,并且在处理未见过的属性值时表现不佳。本文探讨了使用大型语言模型(LLMs)作为更高效且稳健的替代方案。我们提出了适用于零样本和少样本场景的提示模板,并对比了文本和JSON格式的目标模式表示方法。实验结果表明,GPT-4 使用详细的属性描述和示例,达到了最高的平均F1分数85%。Llama-3-70B 的表现也几乎同样出色,提供了一个具有竞争力的开源替代方案。GPT-4 在F1分数上比最佳预训练语言模型(PLM)基线高出5%。微调GPT-3.5 可以提升性能至与GPT-4 相当的水平,但会降低模型对未见过的属性值的泛化能力。

代码仓库

wbsg-uni-mannheim/extractgpt
官方
GitHub 中提及

基准测试

基准方法指标
attribute-value-extraction-on-ae-110kft-GPT-3.5-json-val
F1-score: 86
attribute-value-extraction-on-ae-110kGPT-4-json-val-10-dem
F1-score: 87.5
attribute-value-extraction-on-oa-mineft-GPT-3.5-json-val
F1-score: 84.5
attribute-value-extraction-on-oa-mineGPT-4-json-val-10-dem
F1-score: 82.2

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
ExtractGPT:探索大型语言模型在产品属性值提取中的潜力 | 论文 | HyperAI超神经