
摘要
本文提出了一种基于图神经网络(GNN)模型的图像分类方法。我们将输入图像转换为区域邻接图(RAGs),其中区域由超像素组成,边连接相邻的超像素。实验结果表明,结合了图卷积和自注意力机制的图注意力网络(GATs)优于其他GNN模型。尽管由于在生成RAG过程中存在信息损失,原始图像分类器的表现优于GATs,但我们的方法为超越矩形网格图像的深度学习研究开辟了一个有趣的方向,例如360度全景视图。当前最先进的方法中的传统卷积核无法处理全景图,而适应后的超像素算法及其生成的区域邻接图可以自然地输入到GNN中,且不会出现拓扑问题。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| superpixel-image-classification-on-75 | GAT | Classification Error: 3.81 |