
摘要
从法律文本中识别命名实体是构建其他法律人工智能应用的重要基础。法律文本中的命名实体与常见的命名实体(如人物、组织、地点等)相比,具有不同的特征,且粒度更为精细。本文提出一个全新的语料库,包含46,545个经过标注的法律命名实体,并将其映射至14种法律实体类型。同时,本文还开发了一种用于从判决文本中提取法律命名实体的基线模型。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| ner-on-inlegalner | opennyaiorg/en_legal_ner_trf | F1 score: 91.076 |

从法律文本中识别命名实体是构建其他法律人工智能应用的重要基础。法律文本中的命名实体与常见的命名实体(如人物、组织、地点等)相比,具有不同的特征,且粒度更为精细。本文提出一个全新的语料库,包含46,545个经过标注的法律命名实体,并将其映射至14种法律实体类型。同时,本文还开发了一种用于从判决文本中提取法律命名实体的基线模型。
| 基准 | 方法 | 指标 |
|---|---|---|
| ner-on-inlegalner | opennyaiorg/en_legal_ner_trf | F1 score: 91.076 |