A survey of text detection and recognition algorithms based on deep learning technology

计算机科学 人工智能 光学字符识别 文本检测 文本识别 领域(数学) 机器学习 噪声文本分析 自然语言处理 模式识别(心理学) 情报检索 文本图 图像(数学) 自动汇总 数学 纯数学
作者
Xiaofeng Wang,Zhi-Huang He,Kai Wang,Yifan Wang,Le Zou,Zhize Wu
出处
期刊:Neurocomputing [Elsevier BV]
卷期号:556: 126702-126702 被引量:19
标识
DOI:10.1016/j.neucom.2023.126702
摘要

Optical Character Recognition (OCR) poses a crucial challenge within the realm of computer vision research, as it plays a pivotal role in converting vast amounts of unstructured text data into structured formats to support diverse artificial intelligence applications. The OCR process encompasses two core components: text detection and text recognition. Text detection involves identifying and extracting text regions, achieved through either object detection or segmentation techniques, while text recognition focuses on accurately deciphering the content within these identified regions. In recent years, remarkable strides have been made in the domain of text recognition, primarily driven by deep learning-based models. These models eliminate the need for manual feature processing and excel in recognizing text even within complex scenes, surpassing the performance of traditional text recognition methods and subsequently emerging as the dominant approach. The objective of this paper is to present a comprehensive survey of both text detection and text recognition models. Firstly, we systematically categorize and provide an overview of existing off-the-shelf text detection methods. Subsequently, we conduct an in-depth investigation of six distinct text recognition models, taking into account their unique implementations. Additionally, we explore and analyze the principal datasets that currently prevail in the field of text detection and recognition. Furthermore, this research entails a meticulous performance comparison of various text detection algorithms on the CTW1500, TotalText, and ICDAR2015 datasets. Additionally, we evaluate and scrutinize the efficacy of mainstream text recognition algorithms on the IIIT-5K, SVT, ICDAR2013, SVT-P, CUTE80, and ICDAR2015 datasets. Finally, we conclude with a discussion on the future development and research trends concerning text detection and recognition, providing insights that can further drive progress in this crucial area.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
CLTTT完成签到,获得积分0
2秒前
蒹葭苍苍完成签到 ,获得积分10
8秒前
水晶李完成签到 ,获得积分10
8秒前
white完成签到,获得积分10
16秒前
千玺的小粉丝儿完成签到,获得积分10
26秒前
adazbq完成签到 ,获得积分10
33秒前
changfox完成签到,获得积分10
35秒前
胜胜糖完成签到 ,获得积分10
38秒前
ljlwh完成签到 ,获得积分10
42秒前
wjswift完成签到,获得积分10
50秒前
善善完成签到 ,获得积分10
51秒前
tianshanfeihe完成签到 ,获得积分10
54秒前
hhh2018687完成签到,获得积分10
1分钟前
anhuiwsy完成签到 ,获得积分10
1分钟前
fanssw完成签到 ,获得积分0
1分钟前
小白完成签到 ,获得积分10
1分钟前
桐桐应助JJJ采纳,获得10
1分钟前
欣忆完成签到 ,获得积分10
1分钟前
修水县1个科研人完成签到 ,获得积分10
1分钟前
1分钟前
thchiang发布了新的文献求助10
1分钟前
qiqi完成签到,获得积分10
1分钟前
李思雨完成签到 ,获得积分10
1分钟前
王洋洋完成签到 ,获得积分10
1分钟前
Crystal完成签到 ,获得积分10
1分钟前
深情安青应助thchiang采纳,获得10
1分钟前
棕色垂耳兔完成签到 ,获得积分10
1分钟前
家的温暖完成签到,获得积分10
1分钟前
雷小牛完成签到 ,获得积分10
1分钟前
2分钟前
无限的含羞草完成签到,获得积分10
2分钟前
JJJ发布了新的文献求助10
2分钟前
资山雁完成签到 ,获得积分10
2分钟前
qinghe完成签到 ,获得积分10
2分钟前
Leo完成签到 ,获得积分10
2分钟前
六一儿童节完成签到 ,获得积分10
2分钟前
HCT完成签到,获得积分10
2分钟前
龙王爱吃糖完成签到 ,获得积分10
2分钟前
然来溪完成签到 ,获得积分10
2分钟前
JJJ完成签到,获得积分10
2分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
高温高圧下融剤法によるダイヤモンド単結晶の育成と不純物の評価 5000
Aircraft Engine Design, Third Edition 500
Neonatal and Pediatric ECMO Simulation Scenarios 500
苏州地下水中新污染物及其转化产物的非靶向筛查 500
Rapid Review of Electrodiagnostic and Neuromuscular Medicine: A Must-Have Reference for Neurologists and Physiatrists 500
Vertebrate Palaeontology, 5th Edition 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 内科学 生物化学 物理 计算机科学 纳米技术 遗传学 基因 复合材料 化学工程 物理化学 病理 催化作用 免疫学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 4742445
求助须知:如何正确求助?哪些是违规求助? 4092217
关于积分的说明 12657359
捐赠科研通 3803219
什么是DOI,文献DOI怎么找? 2099669
邀请新用户注册赠送积分活动 1125148
关于科研通互助平台的介绍 1001299