4 个月前

基于变分贝叶斯的胶囊路由

基于变分贝叶斯的胶囊路由

摘要

胶囊网络是一种最近提出的神经网络类型,已被证明在具有挑战性的形状识别任务中优于其他方法。在胶囊网络中,标量神经元被替换为胶囊向量或矩阵,其元素代表对象的不同属性。对象及其组成部分之间的关系通过可训练的视角不变转换矩阵进行学习,而某个特定对象的存在则由其组成部分投票的一致性水平决定。这种交互发生在胶囊层之间,称为“一致性路由”(routing-by-agreement)。本文中,我们提出了一种基于变分贝叶斯的新胶囊路由算法,用于拟合变换高斯混合模型,并展示了将我们的胶囊网络转化为胶囊-变分自编码器(Capsule-VAE)的可能性。我们的贝叶斯方法通过建模胶囊姿态参数的不确定性来解决最大似然估计(MLE)模型的一些固有弱点,例如方差崩溃问题。我们在使用比先前报告少50%的胶囊数量的情况下,在smallNORB数据集上超过了现有最佳性能,并在CIFAR-10、Fashion-MNIST和SVHN数据集上取得了具有竞争力的结果,同时在MNIST到affNIST的泛化能力方面相比之前的工作有了显著提升。

代码仓库

fabio-deep/Variational-Capsule-Routing
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
image-classification-on-smallnorbVB-Routing
Classification Error: 1.29

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于变分贝叶斯的胶囊路由 | 论文 | HyperAI超神经