3 个月前

FusionCount:通过多尺度特征融合实现高效的群体计数

FusionCount:通过多尺度特征融合实现高效的群体计数

摘要

当前最先进的人群计数模型普遍采用编码器-解码器架构。图像首先通过编码器提取特征,随后为校正透视畸变,将最高层级的特征图输入额外模块以提取多尺度特征,再作为解码器的输入生成人群密度图。然而,在这些方法中,编码过程中早期阶段提取的特征未得到充分利用,而多尺度模块所能捕捉的感受野范围有限,且伴随较高的计算开销。本文提出一种新型人群计数架构——FusionCount,该架构通过自适应融合编码器输出的绝大多数特征,而非依赖额外的特征提取组件来获取多尺度信息,从而能够覆盖更广泛的感受野尺度,同时显著降低计算成本。此外,我们设计了一种新型通道压缩模块,在解码阶段能够有效提取显著性信息,进一步提升模型性能。在两个基准数据集上的实验结果表明,所提模型在保持更低计算复杂度的前提下,实现了当前最优的计数性能。

代码仓库

YimingMa/FusionCount
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
crowd-counting-on-shanghaitech-aFusionCount
MAE: 62.2
MSE: 101.2
crowd-counting-on-shanghaitech-bFusionCount
MAE: 6.9
MSE: 11.8

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
FusionCount:通过多尺度特征融合实现高效的群体计数 | 论文 | HyperAI超神经