3 个月前

TIMEN:一个开放的时序表达归一化资源

TIMEN:一个开放的时序表达归一化资源

摘要

时间表达式是指描述时间点、时间段或时间重复性的词语或短语。自动标注这些表达式已成为日益受到关注的研究课题。虽然通过少量监督的机器学习方法即可实现时间表达式的识别,但其准确解释(即归一化)则是一项复杂任务,需要依赖人类知识。本文提出TIMEN——一种由社区共同推动的时间表达式归一化工具。TIMEN基于当前最优方法构建,是一个独立的工具,可轻松集成至现有系统中。我们认为,只有依托大规模知识库与规则集,才能有效完成时间表达式归一化任务。为此,我们设计了一套框架与系统,用于捕获适用于多种语言的时间知识。基于现有数据及新标注的数据,我们展示了具有竞争力的实验结果,并诚邀信息抽取(IE)领域的研究者共同参与构建知识库,以协同解决时间表达式归一化这一关键问题。

基准测试

基准方法指标
timex-normalization-on-timebankTIMEN
F1-Score: 0.89

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
TIMEN:一个开放的时序表达归一化资源 | 论文 | HyperAI超神经