3 个月前

ETH-XGaze:一种用于极端头部姿态与 gaze 变化下的注视估计的大规模数据集

ETH-XGaze:一种用于极端头部姿态与 gaze 变化下的注视估计的大规模数据集

摘要

视线估计是计算机视觉、人机交互以及机器人技术等多个领域中的基础性任务。当前许多先进的视线估计方法均在特定自定义数据集上进行训练与测试,导致不同方法之间的性能比较面临困难。此外,现有视线估计数据集在头部姿态和视线方向的多样性方面较为有限,且评估通常采用不同的实验协议和评价指标,进一步加剧了研究的不一致性。本文提出一种新型视线估计数据集——ETH-XGaze,包含超过一百万张高分辨率图像,覆盖极端头部姿态下的多样化视线情况。该数据集由110名参与者在自研硬件系统下采集,系统配备18台数码单反相机、可调节光照条件,并集成校准系统以精确记录真实视线目标。实验结果表明,该数据集能够显著提升视线估计方法在不同头部姿态和视线角度下的鲁棒性。此外,本文在ETH-XGaze数据集上定义了一套标准化的实验协议与评价指标,旨在推动视线估计研究的规范化与可比性。相关数据集及基准测试网站已公开,访问地址为:https://ait.ethz.ch/projects/2020/ETH-XGaze

代码仓库

基准测试

基准方法指标
gaze-estimation-on-eth-xgazeETHXGaze
Angular Error: 4.7
gaze-estimation-on-mpsgazeResNet18
Angular Error: 8.1

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
ETH-XGaze:一种用于极端头部姿态与 gaze 变化下的注视估计的大规模数据集 | 论文 | HyperAI超神经