4 个月前

面向话语的长科学文档无监督摘要生成

面向话语的长科学文档无监督摘要生成

摘要

我们提出了一种用于长篇科学文档摘录式摘要的无监督图基排名模型。该方法假设源文档具有两级层次图表示,并利用非对称位置线索来确定句子的重要性。在PubMed和arXiv数据集上的实验结果表明,我们的方法在自动评估指标和人工评价方面均大幅优于强大的无监督基线模型。此外,该方法的性能与许多经过数十万例训练的最先进监督方法相当。这些结果表明,话语结构中的模式对于确定科学文章的重要性是一个强有力的信号。

代码仓库

mirandrom/HipoRank
GitHub 中提及

基准测试

基准方法指标
unsupervised-extractive-summarization-onHipoRank
ROUGE-1: 39.34
ROUGE-2: 12.56
ROUGE-L: 34.89
unsupervised-extractive-summarization-onPacSum
ROUGE-1: 38.57
ROUGE-2: 10.93
ROUGE-L: 34.33
unsupervised-extractive-summarization-on-1PacSum
ROUGE-1: 39.79
ROUGE-2: 14.00
ROUGE-L: 36.09
unsupervised-extractive-summarization-on-1HipoRank
ROUGE-1: 43.58
ROUGE-2: 17.00
ROUGE-L: 39.31

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
面向话语的长科学文档无监督摘要生成 | 论文 | HyperAI超神经