4 个月前

一种基于池化的实时显著目标检测设计

一种基于池化的实时显著目标检测设计

摘要

我们通过研究如何在卷积神经网络中扩展池化的作用来解决显著目标检测的问题。基于U形架构,我们首先在自下而上的路径上构建了一个全局引导模块(Global Guidance Module, GGM),旨在为不同特征层次的层提供潜在显著目标的位置信息。为进一步设计了特征聚合模块(Feature Aggregation Module, FAM),以实现自顶向下路径中的粗粒度语义信息与细粒度特征的良好融合。通过在自顶向下路径的融合操作之后添加FAM,可以将GGM提供的粗粒度特征无缝地与多尺度特征结合。这两个基于池化的模块使得高层次语义特征能够逐步细化,从而生成细节丰富的显著图。实验结果表明,我们提出的方法能够更准确地定位显著目标,并且在细节上更加锐利,因此相比之前的最先进方法大幅提升了性能。此外,我们的方法还具有较快的速度,在处理 $300 \times 400$ 图像时可以达到每秒超过30帧(FPS)。代码可以在 http://mmcheng.net/poolnet/ 获取。

代码仓库

backseason/PoolNet
pytorch
GitHub 中提及
balast/saliency_detector
pytorch
GitHub 中提及
Res2Net/Res2Net-PoolNet
pytorch
GitHub 中提及

基准测试

基准方法指标
salient-object-detection-on-dut-omronPoolNet (VGG-16)
F-measure: 0.833
MAE: 0.053
salient-object-detection-on-duts-tePoolNet (VGG-16)
MAE: 0.036
max F-measure: 0.892
salient-object-detection-on-ecssdPoolNet (VGG-16)
F-measure: 0.945
MAE: 0.038
salient-object-detection-on-hku-isPoolNet (VGG-16)
F-measure: 0.935
MAE: 0.03
salient-object-detection-on-pascal-sPoolNet (VGG-16)
F-measure: 0.88
MAE: 0.065
salient-object-detection-on-sodPoolNet (VGG-16)
F-measure: 0.882
MAE: 0.102

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
一种基于池化的实时显著目标检测设计 | 论文 | HyperAI超神经