3 个月前

OneStopEnglish语料库:用于自动可读性评估与文本简化的新语料库

OneStopEnglish语料库:用于自动可读性评估与文本简化的新语料库

摘要

本文介绍了针对三个阅读水平文本的OneStopEnglish语料库的构建与整理过程,并通过两项应用——自动可读性评估与自动文本简化——展示了该语料库的实用价值。该语料库共包含189篇文本,每篇文本均以三种不同难度版本呈现,总计567份文本。目前,该语料库已根据CC BY-SA 4.0许可协议免费开放获取,我们期望其能推动可读性评估与文本简化相关领域的进一步研究。

基准测试

基准方法指标
text-classification-on-onestopenglishSMO (Sequential Minimal Optimization)
Accuracy (5-fold): 0.781

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
OneStopEnglish语料库:用于自动可读性评估与文本简化的新语料库 | 论文 | HyperAI超神经