【技术白皮书】第一章：基于深度学习的文本检测与识别的技术背景

OCR全称Optical Character Recognition，即光学字符识别，最早在1929年被德国科学家Tausheck提出，定义为将印刷体的字符从纸质文档中识别出来。现在的OCR，狭义上指对输入扫描文档图像进行分析处理，识别出图像中文本信息。而随着OCR技术的日益发展，人们已不再仅仅满足于文档或书本上的文本，开始将目标转移到现实世界场景中的文本，这被称为场景文本识别（Scene Text Recognition，STR）。