
摘要
传统的文本检测方法主要针对四边形文本。在本研究中,我们提出了一种名为滑动线点回归(Sliding Line Point Regression, SLPR)的新方法,用于检测自然场景中的任意形状文本。SLPR 通过回归文本行边缘上的多个点,进而利用这些点勾勒出文本的轮廓。所提出的 SLPR 方法可适配多种目标检测架构,如 Faster R-CNN 和 R-FCN。具体而言,我们首先通过区域建议网络(Region Proposal Network, RPN)生成包含文本的最小外接矩形框,随后利用垂直和水平方向滑动的直线对文本边缘上的点进行等距回归。为充分挖掘信息并减少冗余,我们根据矩形框的位置计算目标点的 x 坐标或 y 坐标,仅对剩余的 y 坐标或 x 坐标进行回归。由此,不仅能够有效减少系统参数量,还能抑制生成过于规则多边形的点。该方法在传统的 ICDAR2015 随机场景文本基准数据集以及曲线文本检测数据集 CTW1500 上均取得了具有竞争力的检测效果。
代码仓库
Shualite/UBNet
pytorch
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| scene-text-detection-on-scut-ctw1500 | SLPR | F-Measure: 74.8 Precision: 80.1 Recall: 70.1 |