
摘要
近年来,图像质量的自动学习评估因其在诸多应用场景中的实用性而成为研究热点,例如评估图像采集流程、存储技术以及媒体共享机制。尽管该问题具有较强的主观性,但现有大多数方法仅针对数据集(如AVA[1]和TID2013[2])提供的平均意见评分进行预测。与之不同,我们的方法采用卷积神经网络预测人类主观评分的分布情况。此外,我们的网络架构在性能相当的前提下,显著简化了结构设计。本方法依赖于已被验证且处于前沿水平的深度目标识别网络的成功训练与再训练。由此构建的网络不仅能够以高相关性可靠地评估图像质量,贴近人类感知,还可用于辅助优化摄影流水线中的图像编辑与增强算法。整个过程无需依赖“黄金标准”参考图像,从而实现了单图像、语义感知且符合人类感知的无参考质量评估。
代码仓库
titu1994/neural-image-assessment
tf
GitHub 中提及
MS-Mind/MS-Code-08/tree/main/nima
mindspore
Mind23-2/MindCode-3/tree/main/nima
mindspore
idealo/image-quality-assessment
tf
GitHub 中提及
kentsyx/Neural-IMage-Assessment
pytorch
GitHub 中提及
MS-Mind/MS-Code-06/tree/main/nima
mindspore
truskovskiyk/nima.pytorch
pytorch
GitHub 中提及
Mind23-2/MindCode-101/tree/main/nima
mindspore
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| aesthetics-quality-assessment-on-ava | NIMA | Accuracy: 81.5% |
| image-quality-assessment-on-msu-nr-vqa | NIMA | KLCC: 0.6745 PLCC: 0.8784 SRCC: 0.8494 |
| video-quality-assessment-on-msu-sr-qa-dataset | NIMA | KLCC: 0.20377 PLCC: 0.26550 SROCC: 0.25887 Type: NR |
| video-quality-assessment-on-msu-video-quality | NIMA | KLCC: 0.6745 PLCC: 0.8784 SRCC: 0.8494 Type: NR |