6 个月前

卷积神经网络

计算机视觉

Thomas Verelst Tinne Tuytelaars

摘要

SegBlocks 通过根据图像区域的复杂度动态调整其处理分辨率，显著降低了现有神经网络的计算成本。本方法将图像划分为多个图像块（blocks），并对复杂度较低的区域进行下采样，从而有效减少计算操作次数与内存消耗。一个轻量级策略网络通过强化学习进行训练，用于识别图像中复杂度较高的区域。此外，我们设计了多个基于 CUDA 实现的模块，以高效处理图像块数据。尤为重要的是，我们提出了一种新型的 BlockPad 模块，有效缓解了现有方法在图像块边界处存在的特征不连续问题，同时保持了较低的内存开销。在 Cityscapes、CamVid 以及 Mapillary Vistas 等语义分割数据集上的实验表明，与同等复杂度的静态基线方法相比，动态处理策略在准确率与计算复杂度之间实现了更优的权衡。例如，在 Cityscapes 数据集上，我们的方法使 SwiftNet-RN18 的浮点运算量减少了 60%，推理速度提升了 50%，而 mIoU 准确率仅下降 0.3%。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

卷积神经网络

计算机视觉

Thomas Verelst Tinne Tuytelaars

摘要

SegBlocks 通过根据图像区域的复杂度动态调整其处理分辨率，显著降低了现有神经网络的计算成本。本方法将图像划分为多个图像块（blocks），并对复杂度较低的区域进行下采样，从而有效减少计算操作次数与内存消耗。一个轻量级策略网络通过强化学习进行训练，用于识别图像中复杂度较高的区域。此外，我们设计了多个基于 CUDA 实现的模块，以高效处理图像块数据。尤为重要的是，我们提出了一种新型的 BlockPad 模块，有效缓解了现有方法在图像块边界处存在的特征不连续问题，同时保持了较低的内存开销。在 Cityscapes、CamVid 以及 Mapillary Vistas 等语义分割数据集上的实验表明，与同等复杂度的静态基线方法相比，动态处理策略在准确率与计算复杂度之间实现了更优的权衡。例如，在 Cityscapes 数据集上，我们的方法使 SwiftNet-RN18 的浮点运算量减少了 60%，推理速度提升了 50%，而 mIoU 准确率仅下降 0.3%。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供