Hoang Thanh LamGabriele PiccoYufang HouYoung-Suk LeeLam M. NguyenDzung T. PhanVanessa LópezRamon Fernandez Astudillo

摘要
在众多机器学习任务中,模型通常被训练用于预测结构化数据,例如图结构。例如,在自然语言处理领域,将文本解析为依存句法树或抽象 meaning representation(AMR)图是非常常见的做法。另一方面,集成方法通过融合多个模型的预测结果,生成一个比单个模型更为稳健且准确的新预测结果。尽管文献中已提出多种适用于分类或回归任务的集成技术,但针对图结构预测的集成方法尚未得到充分研究。在本工作中,我们将该问题形式化为:从一组图预测结果中挖掘出被最多支持的、规模最大的图。由于该问题属于NP难问题,我们提出了一种高效的启发式算法以近似最优解。为验证所提方法的有效性,我们在AMR解析任务上进行了实验。实验结果表明,该方法能够有效融合当前最先进的AMR解析器的优势,生成的新预测结果在五个标准基准数据集上均优于任一单一模型。
代码仓库
ibm/graph_ensemble_learning
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| amr-parsing-on-bio | Graphene Smatch | Smatch: 62.8 |
| amr-parsing-on-ldc2017t10 | Graphene Smatch (IBM) | Smatch: 86.26 |
| amr-parsing-on-ldc2017t10 | Graphene Support (IBM) | Smatch: 85.85 |
| amr-parsing-on-ldc2020t02 | Graphene Support (IBM) | Smatch: 84.41 |
| amr-parsing-on-ldc2020t02 | Graphene Smatch (IBM) | Smatch: 84.87 |
| amr-parsing-on-new3 | Graphene Smatch | Smatch: 76.32 |
| amr-parsing-on-the-little-prince | Graphene Smatch | Smatch: 79.52 |