3 个月前

基于Transformer的深度度量学习在专利图像检索中的应用

基于Transformer的深度度量学习在专利图像检索中的应用

摘要

知识产权工作涵盖广泛领域。特别是在专利领域,进行现有技术文献检索时,需要从海量历史文献中找出可用于判断新颖性和创造性的相关文件。针对这一检索需求,长期以来一直迫切需要研发能够直接基于专利图示及发明核心信息进行搜索的技术。然而,专利图示通常以黑白抽象图示形式呈现(少数国家除外),其视觉特征与自然图像存在显著差异,因此该领域尚未得到充分探索。本研究通过在DeepPatent(Kucer等,2022)数据集上引入InfoNCE与ArcFace损失函数,替代传统的三元组损失(Triplet),实现了相较于以往方法更高的检索准确率。此外,我们开发了一款应用系统,使用户能够通过任意图像搜索专利图示。该架构不仅适用于专利图示,还可广泛应用于其他类似模态的图示,如机械制图、外观设计专利图、商标图样、示意图及草图等。

基准测试

基准方法指标
image-retrieval-on-deeppatentSwinV2
mean average precision: 0.856

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于Transformer的深度度量学习在专利图像检索中的应用 | 论文 | HyperAI超神经