请教一个 OCR 的问题，

色郎中 2017-04-17 11:00:48



# -*- encoding: utf-8 -*-

# 导入pillow

from PIL import Image



# 加载原始图片

#img = Image.open("29.jpg").convert('L')

img = Image.open("29.jpg")

# 从左上角开始 剪切 200*200的图片

img2 = img.crop((3, 3, 68, 22))

img2.save("lena2.jpg")

# 识别图片中的字符



from PIL import Image

import pyocr.builders

# pyocr支持两种OCR库，由于我只安装了tesseract，只会获得tesseract

tool = pyocr.get_available_tools()[0]



# 选择要使用的语言，使用print tool.get_available_languages()列表

lang = tool.get_available_languages()[0]



# 用来保存图像和对应的文字

req_image = []

final_text = []

# 为每个图像运行OCR，识别图像中的文本

#for img in range(1):

txt = tool.image_to_string(

        #Image.open(r"E:\2017\ocr\29.jpg"),

        img2,

        lang=lang,

        builder=pyocr.builders.TextBuilder()

    )

final_text.append(txt)

print final_text[0]

代码网上找了两段，，合到一起了；一个纯英文的图片，然后截取一块区域的，并识别小区域内的字符出来

大图

截取出来的小图

识别结果：

Tesseracl



Process finished with exit code 0

最后一个应该"t",,但是识别成了“l”了，，对大图片进行识别的话，基本也是小写“t” 总会和前面一个字符要么粘成一个，要么就是识别错了，什么原因导致？有做过这方面的吗，遇到过类似情况的话，增么解决？
对图片，做了灰度处理，和不做灰度处理，没有明显效果，，除了文件变小了

...全文

121 1 打赏收藏转发到动态举报

写回复

用AI写文章

1 条回复

切换为时间正序

请发表友善的回复…

发表回复

色郎中 2017-04-18

打赏
举报

从新训练了样本还行

对原件，有这几种：1，全中文（含标点，一些英文符号）2，中英文（英文较多，或英文占大多数）3，全英文（这个用finereader8.0）針對1、2 紫光超星阅读器自带的OCR组件尚书七号搞定全中文的ocr。 CAJViewer6里自带的汉王的是最好的,特别是表格的东西慧氏小灵鼠转载于:https://www.cnblogs.com/chen110xi/p/33...

本文章来源于自己的学习图像处理以及识别过程中的一些经验，开发了一个OCR识别身份证程序，此程序虽不够完美但有一定的参考价值，CSDN上本人也将提供源代码，对身份证OCR识别整个过程的一个梳理。程序依赖库，OpenCV3.20 + Tesseract-OCR识别。此程序增加了截取位置识别，以及统一化后的照片识别（900*600）像素清晰的照片进行识别，。对于截取位置识别识别率正确率在90%以...

一、什么是OCR 很早之前就听说有提取图片中文字的工具和方法，这种文字识别技术称为OCR(Optical Character Recognition)。OCR技术的出现，实现了将印刷文字扫描得到的图片转化为文本文字的功能，提供了一种全新的文字输入手段，大大提高了用户工作的效率。二、OCR适合对象　　1.印刷行业、文印店：经常会遇到客户只给你一本厚厚的宣传册(因为客户不知道电子稿保存的重要

这次的任务是对两百余张图片里面特定的编号进行识别，涉及保密的原因，这里就不能粘贴出具体的图片了，下面粘贴出一张类似需要识别的图片。假如说我的数据源如上图所示，那么我需要做的工作就是将上面图片里面标红的数字给识别出来。我采用的算法是，这是基于Tensorflow和keras框架采用ctpn+densenet+CTC算法来完成对图片指定内容的字符识别。

脚本语言

37,720

社区成员

34,239

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

试试用AI创作助手写篇文章吧

+ 用AI写文章