
摘要
盲态或无参考(No-Reference, NR)感知图像质量预测是社会媒体与流媒体产业中一个极具重要性却长期未能解决的难题,直接影响着全球数十亿用户的观看体验。然而,当前主流的NR质量预测模型在真实世界失真图像上的表现普遍不佳。为推动该问题的研究进展,我们构建了迄今为止规模最大的主观图像质量数据库,包含约4万张真实世界失真图像及其对应的12万张图像块(patches),并采集了约400万条人类对图像质量的主观评价数据。基于这些图像与图像块的质量标签,我们设计了深度区域化架构,能够实现当前最先进的全局图像质量预测,同时生成具有实用价值的局部图像质量分布图。我们的创新之处在于提出了一种支持从全局到局部推理以及从局部到全局推理(通过反馈机制)的图像质量预测架构。
代码仓库
baidut/PaQ-2-PiQ
pytorch
GitHub 中提及
fastiqa/fastiqa
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| image-quality-assessment-on-msu-nr-vqa | PaQ-2-PiQ | KLCC: 0.7079 PLCC: 0.8549 SRCC: 0.8705 |
| video-quality-assessment-on-msu-sr-qa-dataset | PaQ-2-PiQ | KLCC: 0.57753 PLCC: 0.70988 SROCC: 0.71167 Type: NR |
| video-quality-assessment-on-msu-video-quality | PaQ-2-PiQ | KLCC: 0.7079 PLCC: 0.8549 SRCC: 0.8705 Type: NR |