4 个月前

文本连贯性:检测任意形状的文本

文本连贯性:检测任意形状的文本

摘要

本文提出了一种名为TextCohesion的像素级场景文本检测方法,该方法将一个文本实例分解为五个关键组件:文本骨架(Text Skeleton)和四个方向像素区域(Directional Pixel Regions)。这些组件比整个文本实例更容易处理。我们设计了一种置信度评分机制,用于过滤与文本相似的字符。当背景复杂时,我们的方法可以密集地整合文本上下文。在两个具有挑战性的弯曲文本基准数据集上的实验表明,TextCohesion优于现有的最先进方法,在Total-Text数据集上达到了84.6%的F值,在SCUT-CTW1500数据集上达到了86.3%的F值。

基准测试

基准方法指标
curved-text-detection-on-scut-ctw1500TextCohesion
F-Measure: 86.3%
scene-text-detection-on-total-textTextCohesion
F-Measure: 84.6%

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供