摘要
得益于机器学习技术的发展,智能手机、可穿戴设备及物联网(IoT)等边缘设备正变得日益智能,但其资源受限的特性也带来了日益突出的矛盾。在边缘设备上实现模型个性化尤为困难,因为在此类设备上训练模型具有极高的资源开销。针对这一挑战,本文提出了一种新型的边缘—云协同训练框架,充分利用云端的强大算力,同时确保数据始终保留在本地边缘端。该设计的亮点包括:基于特征重放(feature replay)实现的并行执行机制、通过误差反馈特征压缩显著降低通信开销,以及具备上下文感知能力的部署决策引擎。作为一个集成系统,所提出的训练框架不仅大幅加速了模型训练过程,同时几乎不带来精度损失,也未增加额外的内存或能耗负担。我们在多种典型场景下对系统进行了验证,涵盖Wi-Fi、5G网络环境,以及家庭物联网应用,并在图像分类、文本分类、图像生成等多种训练任务中进行了测试,结果表明,该系统不仅能够良好适应不同环境,还能有效利用动态变化的上下文条件,为边缘—云协同模型训练提供了一种高效且实用的解决方案。实验结果充分证明了其在性能和适应性方面均优于当前最先进的方法。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| collaborative-filtering-on-movielens-1m | Context-Aware Pipeline | Precision: 0.731 |
| image-classification-on-cifar-10 | Context-Aware Pipeline | Percentage correct: 95.16 |
| image-classification-on-tiny-imagenet-1 | Context-Aware Pipeline | Validation Acc: 73.6% |