
摘要
语义实例分割仍然是一个具有挑战性的任务。在本工作中,我们提出采用一种在像素级别上操作的判别性损失函数来解决该问题,该损失函数促使卷积神经网络生成一种图像表示,使得通过一个简单的后处理步骤即可轻松地将这些表示聚类为不同的实例。该损失函数鼓励网络将每个像素映射到特征空间中的一个点,使得属于同一实例的像素在特征空间中彼此靠近,而不同实例之间则保持较大的间隔。我们提出的将现成网络与基于度量学习目标的合理损失函数相结合的方法,在概念上简洁明了,且与近期的实例分割研究方法有显著区别。与以往工作不同,我们的方法不依赖于目标提议(object proposals)或循环机制。本工作的关键贡献在于证明:即使在没有复杂组件(“花里胡哨”的附加模块)的情况下,这种简单架构依然有效,其性能可与更复杂的现有方法相媲美。此外,我们还表明,该方法避免了当前主流“检测-分割”范式中存在的一些局限性。在Cityscapes和CVPPP叶片分割基准测试中,我们的方法均取得了具有竞争力的性能表现。
代码仓库
nyoki-mtl/pytorch-discriminative-loss
pytorch
GitHub 中提及
davyneven/fastSceneUnderstanding
tf
GitHub 中提及
gymoon10/Instance-Segmentation-with-Discriminative-Loss
pytorch
GitHub 中提及
harryhan618/LaneNet
pytorch
GitHub 中提及
NaturalHistoryMuseum/semantic-segmentation
pytorch
GitHub 中提及
Wizaron/instance-segmentation-pytorch
pytorch
GitHub 中提及
alicranck/instance-seg
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| instance-segmentation-on-cityscapes | Semantic Instance Segmentation with a Discriminative Loss Function | - |
| lane-detection-on-tusimple | Discriminative loss function | Accuracy: 96.40% |
| multi-human-parsing-on-mhp-v10 | DL | AP 0.5: 47.76% |