3 个月前

Efficient-CapsNet:具有自注意力路由的胶囊网络

Efficient-CapsNet:具有自注意力路由的胶囊网络

摘要

深度卷积神经网络在架构设计策略的辅助下,广泛采用数据增强技术以及具有大量特征图的网络层,以嵌入对象的各类变换。然而,这种机制效率极低,尤其在处理大规模数据集时,会导致特征检测器出现大量冗余。尽管胶囊网络(Capsule Networks)尚处于发展初期,但其已被视为扩展现有卷积网络的有前景方向,有望为人工视觉感知引入一种更高效编码所有特征仿射变换的机制。事实上,一个设计合理的胶囊网络理论上应能凭借其固有的泛化能力,在显著减少参数量的情况下实现更优性能。然而,这一关键特性迄今仍鲜受关注。本文系统研究了胶囊网络的效率问题,并通过构建一种极端精简的架构(参数量仅约16万),在不牺牲性能的前提下,证明该架构仅需原始CapsNet约2%的参数量,即可在三个不同数据集上达到当前最优水平。此外,我们提出一种新型非迭代、高度可并行化的路由算法,取代传统的动态路由机制,能够有效应对胶囊数量大幅减少的情况。大量实验对比验证了所提方法的有效性,充分展示了胶囊网络在高效嵌入更具泛化能力的视觉表征方面的潜力。

代码仓库

EscVM/Efficient-CapsNet
官方
tf
GitHub 中提及
kaparoo/Efficient-CapsNet
tf
GitHub 中提及

基准测试

基准方法指标
image-classification-on-mnistEfficient-CapsNet
Accuracy: 99.84
Percentage error: 0.16
Trainable Parameters: 161824
image-classification-on-smallnorbEfficient-CapsNet
Classification Error: 1.23

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
Efficient-CapsNet:具有自注意力路由的胶囊网络 | 论文 | HyperAI超神经