3 个月前

可控句子简化

可控句子简化

摘要

文本简化旨在通过简化语法和结构,使文本更易于阅读和理解,同时保持其核心信息不变。传统上,该任务被视为一种通用的通用型任务,即同一套简化方法适用于所有场景;然而,不同受众群体可能以不同方式从简化文本中获益。为此,我们引入了一种离散参数化机制,为基于序列到序列(Sequence-to-Sequence)模型的简化系统提供了显式的控制能力。通过该机制,用户可根据特定属性(如文本长度、改写程度、词汇复杂度和句法复杂度)对模型生成的简化结果进行条件化调控。我们进一步证明,合理设定这些属性值,可使无需额外微调的序列到序列模型在文本简化基准测试中超越其标准版本的性能表现。我们提出的模型名为ACCESS(即“受众中心的句子简化”Audience-Centric Sentence Simplification的缩写),在WikiLarge测试集上取得了41.87的SARI得分,相较于此前最优报告结果提升了1.42,达到了当前最先进的水平。

代码仓库

基准测试

基准方法指标
text-simplification-on-assetACCESS
BLEU: 75.99*
SARI (EASSEu003e=0.2.1): 40.13
text-simplification-on-turkcorpusACCESS
BLEU: 72.53
SARI (EASSEu003e=0.2.1): 41.38

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
可控句子简化 | 论文 | HyperAI超神经