3 个月前

范数-范数损失在图像质量评估中的应用:更快的收敛速度与更优的性能

范数-范数损失在图像质量评估中的应用:更快的收敛速度与更优的性能

摘要

目前,大多数图像质量评估(IQA)模型均采用MAE或MSE损失函数进行监督训练,但这类方法通常存在收敛速度较慢的问题。众所周知,归一化有助于加速收敛过程。因此,本文探索在IQA损失函数设计中引入归一化机制。具体而言,我们首先对预测的质量得分及其对应的主观质量得分进行归一化处理,随后基于归一化后数值之间的差异范数定义损失函数。由此提出的“归一化之归一化”(Norm-in-Norm)损失函数,能够促使IQA模型对主观质量得分做出线性预测。训练完成后,通过最小二乘回归确定从预测质量到主观质量的线性映射关系。研究表明,该新型损失函数与两种常见的IQA性能评估指标(PLCC和RMSE)具有紧密关联。通过理论分析进一步证明,嵌入的归一化机制可使损失函数的梯度更加稳定且更具可预测性,从而显著促进IQA模型的快速收敛。为进一步验证所提损失函数的有效性,我们将其应用于一个具有挑战性的实际问题:真实场景图像(in-the-wild)的质量评估。在两个相关数据集(KonIQ-10k和CLIVE)上的实验结果表明,相较于传统的MAE或MSE损失,新损失函数可使IQA模型的收敛速度提升约10倍,且最终模型的性能更优。此外,所提出的模型在该挑战性任务上达到了当前最先进的预测性能。为支持可复现的科学研究,相关代码已公开发布于:https://github.com/lidq92/LinearityIQA。

代码仓库

lidq92/LinearityIQA
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
image-quality-assessment-on-msu-nr-vqaLINEARITY
KLCC: 0.7589
PLCC: 0.9106
SRCC: 0.9104
video-quality-assessment-on-msu-sr-qa-datasetLinearity (Norm-in-Norm Loss)
KLCC: 0.52172
PLCC: 0.62204
SROCC: 0.64382
Type: NR
video-quality-assessment-on-msu-video-qualityLINEARITY
KLCC: 0.7589
PLCC: 0.9106
SRCC: 0.9104
Type: NR

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
范数-范数损失在图像质量评估中的应用:更快的收敛速度与更优的性能 | 论文 | HyperAI超神经