3 个月前

SegBlocks:基于块的动态分辨率网络用于实时分割

SegBlocks:基于块的动态分辨率网络用于实时分割

摘要

SegBlocks 通过根据图像区域的复杂度动态调整其处理分辨率,显著降低了现有神经网络的计算成本。本方法将图像划分为多个图像块(blocks),并对复杂度较低的区域进行下采样,从而有效减少计算操作次数与内存消耗。一个轻量级策略网络通过强化学习进行训练,用于识别图像中复杂度较高的区域。此外,我们设计了多个基于 CUDA 实现的模块,以高效处理图像块数据。尤为重要的是,我们提出了一种新型的 BlockPad 模块,有效缓解了现有方法在图像块边界处存在的特征不连续问题,同时保持了较低的内存开销。在 Cityscapes、CamVid 以及 Mapillary Vistas 等语义分割数据集上的实验表明,与同等复杂度的静态基线方法相比,动态处理策略在准确率与计算复杂度之间实现了更优的权衡。例如,在 Cityscapes 数据集上,我们的方法使 SwiftNet-RN18 的浮点运算量减少了 60%,推理速度提升了 50%,而 mIoU 准确率仅下降 0.3%。

基准测试

基准方法指标
real-time-semantic-segmentation-on-cityscapesSegBlocks-RN18 (t=0.4)
Frame (fps): 48.6 (1080Ti)
mIoU: 73.8%
semantic-segmentation-on-mapillary-valSegBlocks-RN50 (t=0.4)
mIoU: 39.7

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
SegBlocks:基于块的动态分辨率网络用于实时分割 | 论文 | HyperAI超神经