7 个月前

卷积神经网络

计算机视觉

Wei Liu extsuperscript1* Irtiza Hasan extsuperscript2* Shengcai Liao extsuperscript2**

摘要

目标检测通常需要传统的滑动窗口分类器或现代深度学习方法中的基于锚框的预测。然而，这两种方法都需要对边界框进行繁琐的配置。在本文中，我们提供了一种新的视角，将目标检测视为一种高层次语义特征检测任务。类似于边缘、角点、斑点等其他特征检测器，所提出的检测器在整个图像上扫描特征点，卷积运算天然适合这一过程。但是，与这些传统的低层次特征不同，所提出的检测器追求更高层次的抽象，即寻找存在对象的中心点，而现代深度模型已经具备了这种高层次语义抽象的能力。此外，类似于斑点检测，我们还预测中心点的尺度，这也是一个直接的卷积操作。因此，在本文中，行人和人脸检测被简化为通过卷积进行中心点和尺度预测的任务。这样，所提出的方法实现了无边界框设置。尽管结构简单，但在包括行人检测和人脸检测在内的多个具有挑战性的基准测试中表现出竞争力的准确性。此外，还进行了跨数据集评估，展示了该方法优越的泛化能力。代码和模型可从以下链接获取：https://github.com/liuwei16/CSP 和 https://github.com/hasanirtiza/Pedestron。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

7 个月前

卷积神经网络

计算机视觉

Wei Liu extsuperscript1* Irtiza Hasan extsuperscript2* Shengcai Liao extsuperscript2**

摘要

目标检测通常需要传统的滑动窗口分类器或现代深度学习方法中的基于锚框的预测。然而，这两种方法都需要对边界框进行繁琐的配置。在本文中，我们提供了一种新的视角，将目标检测视为一种高层次语义特征检测任务。类似于边缘、角点、斑点等其他特征检测器，所提出的检测器在整个图像上扫描特征点，卷积运算天然适合这一过程。但是，与这些传统的低层次特征不同，所提出的检测器追求更高层次的抽象，即寻找存在对象的中心点，而现代深度模型已经具备了这种高层次语义抽象的能力。此外，类似于斑点检测，我们还预测中心点的尺度，这也是一个直接的卷积操作。因此，在本文中，行人和人脸检测被简化为通过卷积进行中心点和尺度预测的任务。这样，所提出的方法实现了无边界框设置。尽管结构简单，但在包括行人检测和人脸检测在内的多个具有挑战性的基准测试中表现出竞争力的准确性。此外，还进行了跨数据集评估，展示了该方法优越的泛化能力。代码和模型可从以下链接获取：https://github.com/liuwei16/CSP 和 https://github.com/hasanirtiza/Pedestron。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供