8 个月前

卷积神经网络

计算机视觉

Zilu Guo Liuyang Bian Xuan Huang Hu Wei Jingyu Li Huasheng Ni

摘要

空洞卷积被用作在语义分割任务中增加感受野的一种方法。然而，在以往的语义分割工作中，这种方法很少被应用于模型的浅层。我们重新审视了现代卷积神经网络（CNNs）中空洞卷积的设计，并证明了使用大内核来应用空洞卷积可能是一种更强大的范式。为此，我们提出了三条指导原则，以更高效地应用空洞卷积。遵循这些指导原则，我们设计了DSNet，一种双分支CNN架构，该架构不仅在模型的浅层引入了空洞卷积，还通过在ImageNet上预训练几乎整个编码器来实现更好的性能。为了验证我们方法的有效性，我们的模型在ADE20K、Cityscapes和BDD数据集上实现了新的精度与速度之间的最佳权衡。具体而言，DSNet在ADE20K数据集上达到了40.0%的mIOU（平均交并比），推理速度为179.2帧每秒（FPS），而在Cityscapes数据集上则达到了80.4%的mIOU，推理速度为81.9 FPS。源代码和模型可在GitHub上获取：https://github.com/takaniwa/DSNet。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

8 个月前

卷积神经网络

计算机视觉

Zilu Guo Liuyang Bian Xuan Huang Hu Wei Jingyu Li Huasheng Ni

摘要

空洞卷积被用作在语义分割任务中增加感受野的一种方法。然而，在以往的语义分割工作中，这种方法很少被应用于模型的浅层。我们重新审视了现代卷积神经网络（CNNs）中空洞卷积的设计，并证明了使用大内核来应用空洞卷积可能是一种更强大的范式。为此，我们提出了三条指导原则，以更高效地应用空洞卷积。遵循这些指导原则，我们设计了DSNet，一种双分支CNN架构，该架构不仅在模型的浅层引入了空洞卷积，还通过在ImageNet上预训练几乎整个编码器来实现更好的性能。为了验证我们方法的有效性，我们的模型在ADE20K、Cityscapes和BDD数据集上实现了新的精度与速度之间的最佳权衡。具体而言，DSNet在ADE20K数据集上达到了40.0%的mIOU（平均交并比），推理速度为179.2帧每秒（FPS），而在Cityscapes数据集上则达到了80.4%的mIOU，推理速度为81.9 FPS。源代码和模型可在GitHub上获取：https://github.com/takaniwa/DSNet。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供