37,720
社区成员
发帖
与我相关
我的任务
分享
# -*- encoding: utf-8 -*-
# 导入pillow
from PIL import Image
# 加载原始图片
#img = Image.open("29.jpg").convert('L')
img = Image.open("29.jpg")
# 从左上角开始 剪切 200*200的图片
img2 = img.crop((3, 3, 68, 22))
img2.save("lena2.jpg")
# 识别图片中的字符
from PIL import Image
import pyocr.builders
# pyocr支持两种OCR库,由于我只安装了tesseract,只会获得tesseract
tool = pyocr.get_available_tools()[0]
# 选择要使用的语言,使用print tool.get_available_languages()列表
lang = tool.get_available_languages()[0]
# 用来保存图像和对应的文字
req_image = []
final_text = []
# 为每个图像运行OCR,识别图像中的文本
#for img in range(1):
txt = tool.image_to_string(
#Image.open(r"E:\2017\ocr\29.jpg"),
img2,
lang=lang,
builder=pyocr.builders.TextBuilder()
)
final_text.append(txt)
print final_text[0]
Tesseracl
Process finished with exit code 0