4 个月前

基于动态参数预测的卷积神经网络图像问答

基于动态参数预测的卷积神经网络图像问答

摘要

我们通过学习一个带有动态参数层的卷积神经网络(CNN)来解决图像问答(ImageQA)问题,该动态参数层的权重根据问题自适应地确定。为了实现自适应参数预测,我们采用了单独的参数预测网络,该网络由一个以问题为输入的门控循环单元(GRU)和一个生成候选权重集的全连接层组成。然而,构建用于CNN全连接动态参数层中大量参数的参数预测网络是一个挑战。我们通过引入哈希技术降低了这一问题的复杂性,其中参数预测网络提供的候选权重通过预定义的哈希函数选择,以确定动态参数层中的各个权重。所提出的联合网络——包括用于ImageQA的CNN和参数预测网络——通过反向传播端到端训练,其权重初始化使用了预训练的CNN和GRU。所提出的算法在所有可用的公共ImageQA基准测试中均展示了最先进的性能。

代码仓库

HyeonwooNoh/DPPnet
pytorch
GitHub 中提及

基准测试

基准方法指标
image-retrieval-with-multi-modal-query-onParam Hashing
Recall@1: 12.2
Recall@10: 40
Recall@50: 61.7

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于动态参数预测的卷积神经网络图像问答 | 论文 | HyperAI超神经