6 个月前

计算机视觉

视觉文档检索

计算机视觉

Keiji Yanai Kotaro Higuchi

摘要

知识产权工作涵盖广泛领域。特别是在专利领域，进行现有技术文献检索时，需要从海量历史文献中找出可用于判断新颖性和创造性的相关文件。针对这一检索需求，长期以来一直迫切需要研发能够直接基于专利图示及发明核心信息进行搜索的技术。然而，专利图示通常以黑白抽象图示形式呈现（少数国家除外），其视觉特征与自然图像存在显著差异，因此该领域尚未得到充分探索。本研究通过在DeepPatent（Kucer等，2022）数据集上引入InfoNCE与ArcFace损失函数，替代传统的三元组损失（Triplet），实现了相较于以往方法更高的检索准确率。此外，我们开发了一款应用系统，使用户能够通过任意图像搜索专利图示。该架构不仅适用于专利图示，还可广泛应用于其他类似模态的图示，如机械制图、外观设计专利图、商标图样、示意图及草图等。

源 PDF 查看代码

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

计算机视觉

视觉文档检索

计算机视觉

Keiji Yanai Kotaro Higuchi

摘要

知识产权工作涵盖广泛领域。特别是在专利领域，进行现有技术文献检索时，需要从海量历史文献中找出可用于判断新颖性和创造性的相关文件。针对这一检索需求，长期以来一直迫切需要研发能够直接基于专利图示及发明核心信息进行搜索的技术。然而，专利图示通常以黑白抽象图示形式呈现（少数国家除外），其视觉特征与自然图像存在显著差异，因此该领域尚未得到充分探索。本研究通过在DeepPatent（Kucer等，2022）数据集上引入InfoNCE与ArcFace损失函数，替代传统的三元组损失（Triplet），实现了相较于以往方法更高的检索准确率。此外，我们开发了一款应用系统，使用户能够通过任意图像搜索专利图示。该架构不仅适用于专利图示，还可广泛应用于其他类似模态的图示，如机械制图、外观设计专利图、商标图样、示意图及草图等。

源 PDF 查看代码

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供