17 天前

用于快速目标检测的统一多尺度深度卷积神经网络

用于快速目标检测的统一多尺度深度卷积神经网络

摘要

提出了一种统一的深度神经网络——多尺度卷积神经网络(Multi-Scale CNN, MS-CNN),用于实现快速的多尺度目标检测。MS-CNN由一个候选区域生成子网络和一个检测子网络组成。在候选区域生成子网络中,检测在多个输出层上进行,使得感受野能够匹配不同尺度的目标。这些互补的、针对特定尺度的检测器被整合,从而构建出一个强大的多尺度目标检测器。整个统一网络通过优化多任务损失函数,实现端到端的训练。此外,还探索了采用反卷积进行特征上采样,作为输入上采样的替代方案,以降低内存占用和计算成本。在包含大量小目标的数据集(如KITTI和Caltech)上,该方法实现了达到每秒15帧(15 fps)的当前最优目标检测性能。

代码仓库

基准测试

基准方法指标
face-detection-on-wider-face-hardMSCNN
AP: 0.809
pedestrian-detection-on-caltechMS-CNN
Reasonable Miss Rate: 9.95

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
用于快速目标检测的统一多尺度深度卷积神经网络 | 论文 | HyperAI超神经