6 个月前

摘要

在真实场景中获取的视频的感知质量评估，对于保障视频服务质量具有重要意义。由于难以获得具有原始质量的参考视频，且真实场景下的失真类型复杂多样，给盲视频质量评估（Blind Video Quality Assessment, BVQA）任务带来了巨大挑战。尽管基于模型的迁移学习是解决BVQA任务的一种有效且高效的方法，但如何识别并有效弥合不同数据域之间的分布差异，以获得更优的视频表征，仍是亟待解决的问题。在本研究中，我们提出从包含真实失真图像的质量评估（Image Quality Assessment, IQA）数据库，以及具有丰富运动模式的大规模动作识别数据集中迁移知识。我们综合利用这两类数据来学习特征提取器。在目标视频质量评估（VQA）数据库上，采用混合列表级排序损失函数（mixed list-wise ranking loss function）对所提模型进行训练。在六个不同数据库上的大量实验表明，无论是在单一数据库训练还是混合数据库训练的设置下，本方法均表现出优异的性能，具有很强的竞争力。此外，我们验证了所提方法中各组成部分的合理性，并探索了一种简洁有效的改进方式，进一步提升了模型性能。

源 PDF