17 天前

用于情境识别的循环模型

用于情境识别的循环模型

摘要

本文提出了一种基于循环神经网络(RNN)的模型,用于预测结构化的“图像情境”——即与特定动作相关的动作本身以及承担语义角色的名词实体。与以往依赖条件随机场(CRF)的方法不同,本文采用一个专门设计的动作预测网络,随后接一个RNN进行名词预测。该系统在具有挑战性的imSitu数据集上取得了当前最优的准确率,显著优于基于CRF的模型,包括那些利用额外数据进行训练的模型。此外,我们还证明,从情境预测任务中学到的专用特征,可有效迁移至图像描述生成任务中,从而更准确地描述人与物体之间的交互关系。

基准测试

基准方法指标
grounded-situation-recognition-on-swigRNN + Fusion
Top-1 Verb: 35.9
Top-1 Verb u0026 Value: 27.45
Top-5 Verbs: 63.08
Top-5 Verbs u0026 Value: 46.88
situation-recognition-on-imsituRNN + Fusion
Top-1 Verb: 35.9
Top-1 Verb u0026 Value: 27.45
Top-5 Verbs: 63.08
Top-5 Verbs u0026 Value: 46.88

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
用于情境识别的循环模型 | 论文 | HyperAI超神经