17 天前

基于滑动线点回归的形状鲁棒场景文本检测

基于滑动线点回归的形状鲁棒场景文本检测

摘要

传统的文本检测方法主要针对四边形文本。在本研究中,我们提出了一种名为滑动线点回归(Sliding Line Point Regression, SLPR)的新方法,用于检测自然场景中的任意形状文本。SLPR 通过回归文本行边缘上的多个点,进而利用这些点勾勒出文本的轮廓。所提出的 SLPR 方法可适配多种目标检测架构,如 Faster R-CNN 和 R-FCN。具体而言,我们首先通过区域建议网络(Region Proposal Network, RPN)生成包含文本的最小外接矩形框,随后利用垂直和水平方向滑动的直线对文本边缘上的点进行等距回归。为充分挖掘信息并减少冗余,我们根据矩形框的位置计算目标点的 x 坐标或 y 坐标,仅对剩余的 y 坐标或 x 坐标进行回归。由此,不仅能够有效减少系统参数量,还能抑制生成过于规则多边形的点。该方法在传统的 ICDAR2015 随机场景文本基准数据集以及曲线文本检测数据集 CTW1500 上均取得了具有竞争力的检测效果。

代码仓库

基准测试

基准方法指标
scene-text-detection-on-scut-ctw1500SLPR
F-Measure: 74.8
Precision: 80.1
Recall: 70.1

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于滑动线点回归的形状鲁棒场景文本检测 | 论文 | HyperAI超神经