3 个月前

ConvFinQA:探索对话式金融问答中的数值推理链

ConvFinQA:探索对话式金融问答中的数值推理链

摘要

随着大规模预训练语言模型的快速发展,研究人员在自然语言处理(NLP)任务中取得了前所未有的性能突破,这些任务主要集中于语言模式匹配。当前学术界的研究重心正从语言建模本身,逐步转向模拟人类复杂的推理能力。在本工作中,我们聚焦于金融这一现实世界中涉及复杂数值推理的应用领域。为此,我们提出了一项全新的大规模数据集——ConvFinQA,旨在研究对话式问答中的数值推理链(chain of numerical reasoning)。该数据集在真实对话场景下,对建模长距离、复杂数值推理路径提出了严峻挑战。我们采用神经符号方法与基于提示(prompting)的方法,开展了全面的实验与分析,深入探讨了这两类方法在复杂推理机制上的异同。我们相信,该数据集将为推动下一代研究——即现实世界中复杂推理任务的探索——提供宝贵资源。相关数据集与代码已公开发布于:https://github.com/czyssrs/ConvFinQA。

代码仓库

czyssrs/convfinqa
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
conversational-question-answering-onFinQANet (RoBERTa-large)
Execution Accuracy: 68.90
Program Accuracy: 68.24
question-answering-on-convfinqaFinQANet (RoBERTa-large)
Execution Accuracy: 68.9

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
ConvFinQA:探索对话式金融问答中的数值推理链 | 论文 | HyperAI超神经