6 个月前

计算机视觉

AJ Piergiovanni Michael S. Ryoo

摘要

我们提出一个用于动作识别的新公共视频数据集：来自多个国家的匿名化视频（Anonymized Videos from Diverse countries, 简称 AViD）。与现有的公共视频数据集不同，AViD 是一个涵盖多个不同国家的动作视频集合。其核心动机在于构建一个面向全球公众的数据集，以促进动作识别模型的训练与预训练，而非仅服务于少数特定国家。此外，AViD 中所有视频中的人脸身份均已进行妥善匿名化处理，以充分保护个人隐私。该数据集为静态数据集，每段视频均采用知识共享（Creative Commons）许可协议发布。我们验证发现，现有大多数视频数据集在统计上存在显著偏差，主要集中于少数几个国家的动作视频。通过实验我们进一步证明，基于此类有偏数据集训练的模型，在迁移到其他国家的动作视频时，性能表现并不理想。而 AViD 数据集有效缓解了这一问题。同时，我们还验证了 AViD 可作为优秀的预训练数据集，其性能可与甚至优于以往的公开数据集。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

计算机视觉

AJ Piergiovanni Michael S. Ryoo

摘要

我们提出一个用于动作识别的新公共视频数据集：来自多个国家的匿名化视频（Anonymized Videos from Diverse countries, 简称 AViD）。与现有的公共视频数据集不同，AViD 是一个涵盖多个不同国家的动作视频集合。其核心动机在于构建一个面向全球公众的数据集，以促进动作识别模型的训练与预训练，而非仅服务于少数特定国家。此外，AViD 中所有视频中的人脸身份均已进行妥善匿名化处理，以充分保护个人隐私。该数据集为静态数据集，每段视频均采用知识共享（Creative Commons）许可协议发布。我们验证发现，现有大多数视频数据集在统计上存在显著偏差，主要集中于少数几个国家的动作视频。通过实验我们进一步证明，基于此类有偏数据集训练的模型，在迁移到其他国家的动作视频时，性能表现并不理想。而 AViD 数据集有效缓解了这一问题。同时，我们还验证了 AViD 可作为优秀的预训练数据集，其性能可与甚至优于以往的公开数据集。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供