6 个月前

计算机视觉

Konstantin Sofiiuk Ilia A. Petrov Anton Konushin

摘要

基于点击的交互式分割近期研究通过采用多种推理时优化策略，取得了当前最先进的性能。然而，与前向传播方法相比，这些方法在计算成本上显著更高，因为它们在推理过程中需要进行反向传播，难以部署于通常仅支持前向传播的移动端框架。本文对交互式分割的多种设计选择进行了全面评估，发现无需任何额外优化策略即可获得新的最先进结果。因此，我们提出了一种简洁的前向传播模型，用于基于点击的交互式分割，该模型利用前序步骤生成的分割掩码。该方法不仅能够完整分割新对象，还可从外部提供的掩码出发进行修正。在分析不同数据集上训练模型的性能时，我们发现训练数据集的选择对交互式分割质量具有显著影响。研究发现，在包含COCO与LVIS的组合数据集上，结合多样化且高质量标注的模型，其性能超越了所有现有方法。代码与训练好的模型已公开，详见：https://github.com/saic-vul/ritm_interactive_segmentation。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

计算机视觉

Konstantin Sofiiuk Ilia A. Petrov Anton Konushin

摘要

基于点击的交互式分割近期研究通过采用多种推理时优化策略，取得了当前最先进的性能。然而，与前向传播方法相比，这些方法在计算成本上显著更高，因为它们在推理过程中需要进行反向传播，难以部署于通常仅支持前向传播的移动端框架。本文对交互式分割的多种设计选择进行了全面评估，发现无需任何额外优化策略即可获得新的最先进结果。因此，我们提出了一种简洁的前向传播模型，用于基于点击的交互式分割，该模型利用前序步骤生成的分割掩码。该方法不仅能够完整分割新对象，还可从外部提供的掩码出发进行修正。在分析不同数据集上训练模型的性能时，我们发现训练数据集的选择对交互式分割质量具有显著影响。研究发现，在包含COCO与LVIS的组合数据集上，结合多样化且高质量标注的模型，其性能超越了所有现有方法。代码与训练好的模型已公开，详见：https://github.com/saic-vul/ritm_interactive_segmentation。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供