4 个月前

GRITv2:高效轻量级社会关系识别

GRITv2:高效轻量级社会关系识别

摘要

我们的研究重点在于图基关系推理变压器(Graph-based Relation Inference Transformer, GRIT)的分析和改进,该模型在该领域中是一个重要的基准。我们使用PISC-fine数据集进行了全面的消融研究,以发现并探索GRITv2在效率和性能上的提升。本研究提供了一种新的最先进的关系识别模型,适用于PISC关系数据集。我们在GRIT模型中引入了若干新特性,并对两个版本的新基准进行了分析:大型版GRITv2-L和小型版GRITv2-S。我们提出的GRITv2-L在关系识别方面超越了现有方法,而GRITv2-S的性能仅比GRITv2-L低2%,但其模型大小和参数仅为GRITv2-L的0.0625倍。此外,我们还解决了模型压缩的需求,这是在资源受限平台上部署高效模型的关键领域。通过应用量化技术,我们将GRITv2-S的模型大小高效地缩减至22MB,并成功部署到旗舰级的一加12手机上,其性能仍然超过了PISC-fine数据集的基准,突显了我们的模型在移动设备上的实际可行性和改进后的效率。

基准测试

基准方法指标
visual-social-relationship-recognition-onGRITv2-L
mAP: 80.7
mAP (Coarse): 87.8

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
GRITv2:高效轻量级社会关系识别 | 论文 | HyperAI超神经