4 个月前

监督金字塔上下文网络的场景文本检测

监督金字塔上下文网络的场景文本检测

摘要

基于深度学习的场景文字检测方法在过去几年中取得了显著成果。然而,由于自然场景的高度多样性和复杂性,现有的最先进文字检测方法在应用于实际环境中的图像时,仍可能产生大量误检。为了解决这一问题,我们主要受到Mask R-CNN的启发,在本文中提出了一种基于特征金字塔网络(Feature Pyramid Network, FPN)和实例分割的有效模型。我们提出了监督金字塔上下文网络(Supervised Pyramid Context Network, SPCNET),以精确定位文字区域并抑制误检。得益于语义信息的引导和共享FPN,SPCNET在引入少量额外计算的同时显著提升了性能。在标准数据集上的实验表明,我们的SPCNET明显优于现有最先进方法。具体而言,它在ICDAR2013上实现了92.1%的F值,在ICDAR2015上实现了87.2%的F值,在ICDAR2017 MLT上实现了74.1%的F值,在Total-Text上实现了82.9%的F值。

代码仓库

基准测试

基准方法指标
scene-text-detection-on-icdar-2013SPCNET
F-Measure: 92.1%
Precision: 93.8
Recall: 90.5
scene-text-detection-on-icdar-2015SPCNET
F-Measure: 87.2
Precision: 88.7
Recall: 85.8
scene-text-detection-on-icdar-2017-mlt-1SPCNET
F-Measure: 74.1%
Precision: 80.6
Recall: 68.6
scene-text-detection-on-total-textSPCNET
F-Measure: 82.9%
Precision: 83
Recall: 82.8

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
监督金字塔上下文网络的场景文本检测 | 论文 | HyperAI超神经