
摘要
得益于前沿计算技术、加速的硬件架构以及微型人工智能算法的发展,智能眼镜正迅速实现功能升级。然而,在追求全天候使用以提供良好用户体验的前提下,将人工智能集成到外形紧凑、电池容量有限的智能眼镜中,仍面临重大挑战。本文阐述了一种微型机器学习算法的设计与实现,该算法利用新型低功耗处理器,实现了智能眼镜的长时间连续运行。研究聚焦于实时目标检测场景下智能眼镜在能效与延迟方面的优化。为此,我们构建了一款智能眼镜原型系统,作为研究平台,其包含两个微控制器:一个新型毫瓦级功耗的RISC-V并行处理器,配备用于视觉人工智能的硬件加速单元;以及一个用于通信的低功耗蓝牙模块。该智能眼镜集成了电源动态切换机制,包括图像与音频传感接口。此外,我们开发了一组基于YOLO架构的新型微型深度学习模型——TinyissimoYOLO v1.3、v5和v8,这些模型参数量低于百万级,专为基于微控制器的推理任务定制,旨在对智能眼镜上的目标检测性能进行能效与延迟的基准测试。对原型系统的评估表明,TinyissimoYOLO在单次推理中实现17毫秒的延迟,能耗仅为1.59毫焦耳,同时保持了可接受的检测精度。进一步测试显示,从图像采集到算法预测的端到端延迟为56毫秒,相当于18帧每秒的处理速率,总功耗为62.9毫瓦,对应154mAh电池可支持连续运行约9.3小时。该性能显著优于MCUNet(TinyNAS+TinyEngine)方案,后者仅执行更简单的图像分类任务,帧率仅为7.3帧每秒。
代码仓库
eth-pbl/tinyissimoyolo
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| object-detection-on-pascal-voc | TinyissimoYOLO-v8 | Parameters(K): 839 |
| object-detection-on-pascal-voc-2007 | TinyissimoYOLO-v8 | MAP: 42.3% |