6 个月前

卷积神经网络

计算机视觉

Divya Kothandaraman Tianrui Guan Xijun Wang Sean Hu Ming Lin Dinesh Manocha

摘要

我们提出了一种用于无人机（UAV）视频行为识别的算法——傅里叶行为识别（Fourier Activity Recognition, FAR）。该方法引入了一种新颖的傅里叶物体解耦机制，能够天然地将通常占据较小空间的行人主体与背景分离。该解耦技术在频域中运行，用于表征空间像素随时间变化的程度，并利用傅里叶变换的卷积-乘积特性，将这一频域表征映射至网络所提取的物体-背景混合特征中。为捕捉上下文信息以及长距离时空依赖关系，我们进一步提出了一种新型傅里叶注意力机制（Fourier Attention），该机制通过在频域建模加权外积来模拟自注意力的优势，同时显著降低计算开销。相比传统自注意力，本方法的计算量大幅减少。我们在多个无人机数据集上对所提方法进行了评估，包括UAV Human RGB、UAV Human Night、Drone Action和NEC Drone数据集。实验结果表明，该方法在Top-1准确率上相较现有方法实现了8.02%至38.69%的相对提升，且推理速度最快可达先前方法的3倍。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

卷积神经网络

计算机视觉

Divya Kothandaraman Tianrui Guan Xijun Wang Sean Hu Ming Lin Dinesh Manocha

摘要

我们提出了一种用于无人机（UAV）视频行为识别的算法——傅里叶行为识别（Fourier Activity Recognition, FAR）。该方法引入了一种新颖的傅里叶物体解耦机制，能够天然地将通常占据较小空间的行人主体与背景分离。该解耦技术在频域中运行，用于表征空间像素随时间变化的程度，并利用傅里叶变换的卷积-乘积特性，将这一频域表征映射至网络所提取的物体-背景混合特征中。为捕捉上下文信息以及长距离时空依赖关系，我们进一步提出了一种新型傅里叶注意力机制（Fourier Attention），该机制通过在频域建模加权外积来模拟自注意力的优势，同时显著降低计算开销。相比传统自注意力，本方法的计算量大幅减少。我们在多个无人机数据集上对所提方法进行了评估，包括UAV Human RGB、UAV Human Night、Drone Action和NEC Drone数据集。实验结果表明，该方法在Top-1准确率上相较现有方法实现了8.02%至38.69%的相对提升，且推理速度最快可达先前方法的3倍。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供