4 个月前

为摘要带来结构:面向多面的长科学文档摘要数据集

为摘要带来结构:面向多面的长科学文档摘要数据集

摘要

多角度摘要提供了从不同视角对文档进行简要概述的方法。借助结构化的提纲,读者可以快速理解长篇文档的主要观点。然而,由于缺乏大规模的多角度摘要数据集,这一领域的研究相对较少。在本研究中,我们介绍了FacetSum(多角度摘要基准),该基准基于Emerald期刊文章构建,涵盖了多个不同的领域。与传统的文档-摘要对不同,FacetSum提供了多个摘要,每个摘要针对长篇文档的具体部分,包括目的、方法、发现和价值。我们在数据集上的分析和实证结果揭示了将结构引入摘要的重要性。我们认为,FacetSum将推动摘要研究的进一步发展,并促进能够利用长文本和摘要中结构化信息的自然语言处理系统的开发。

代码仓库

bnitsan/papertweet
pytorch
GitHub 中提及

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
为摘要带来结构:面向多面的长科学文档摘要数据集 | 论文 | HyperAI超神经