3 个月前

面向文本简化优化统计机器翻译

面向文本简化优化统计机器翻译

摘要

目前大多数句子简化系统采用基础的机器翻译模型,通过人工简化平行语料库学习词汇和句法层面的同义表达。然而,这类方法受限于人工简化语料的质量与规模,而构建此类语料成本高昂。本文深入探索了统计机器翻译技术在句子简化任务中的适配应用,充分利用从双语文本中学习到的大规模同义表达,并结合少量具有多参考答案的人工简化数据。本研究首次设计出适用于句子简化系统的自动评估指标,能够有效支持系统的调优与评估,从而推动该任务的迭代式开发。

基准测试

基准方法指标
text-simplification-on-turkcorpusSBMT-SARI
BLEU: 73.08*
SARI (EASSEu003e=0.2.1): 39.56

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
面向文本简化优化统计机器翻译 | 论文 | HyperAI超神经