8 个月前

多任务学习

计算机视觉

Yong Liu Cairong Zhang Yitong Wang Jiahao Wang Yujiu Yang Yansong Tang

摘要

本文旨在实现任意语义层次的通用分割。尽管近年来取得了显著进展，但专门的分割方法仍局限于特定任务和数据分布。为了适应新场景或设置而重新训练新的模型需要高昂的计算和时间成本，这引发了对多功能且通用的分割模型的需求，该模型能够满足不同粒度的要求。虽然已经有一些尝试统一不同的分割任务或将模型泛化到各种场景中，但由于范式定义和输入输出空间的局限性，这些方法难以在任意粒度上准确理解内容。为此，我们提出了 UniLSeg，这是一种能够在语言指令指导下执行任意语义层次分割的通用模型。为了训练 UniLSeg，我们将一组来自原始多样化分布的任务重组为统一的数据格式，其中图像和描述分割目标的文字作为输入，相应的掩码作为输出。结合自动标注引擎以利用大量未标注数据，UniLSeg 在各种任务和设置中表现出色，超越了专门和统一的分割模型。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

8 个月前

多任务学习

计算机视觉

Yong Liu Cairong Zhang Yitong Wang Jiahao Wang Yujiu Yang Yansong Tang

摘要

本文旨在实现任意语义层次的通用分割。尽管近年来取得了显著进展，但专门的分割方法仍局限于特定任务和数据分布。为了适应新场景或设置而重新训练新的模型需要高昂的计算和时间成本，这引发了对多功能且通用的分割模型的需求，该模型能够满足不同粒度的要求。虽然已经有一些尝试统一不同的分割任务或将模型泛化到各种场景中，但由于范式定义和输入输出空间的局限性，这些方法难以在任意粒度上准确理解内容。为此，我们提出了 UniLSeg，这是一种能够在语言指令指导下执行任意语义层次分割的通用模型。为了训练 UniLSeg，我们将一组来自原始多样化分布的任务重组为统一的数据格式，其中图像和描述分割目标的文字作为输入，相应的掩码作为输出。结合自动标注引擎以利用大量未标注数据，UniLSeg 在各种任务和设置中表现出色，超越了专门和统一的分割模型。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供