vs2010调用tesseract识别汉字乱码怎么解决

qq40911462 2015-04-17 04:21:54

最近使用vs2010调用tesseract识别汉字乱码，是编码的问题吗，识别数字是没有问题的，程序如下：
#pragma comment(lib, "libtesseract302.lib")
#include "baseapi.h"
#include "basedir.h"
#include "strngs.h"
#include "allheaders.h"
int main()
{
char *outText;
tesseract::TessBaseAPI *api = new tesseract::TessBaseAPI();
// Initialize tesseract-ocr with English, without specifying tessdata path
if (api->Init(NULL, "eng")) {
fprintf(stderr, "Could not initialize tesseract.\n");
exit(1);
}
// Open input image with leptonica library
Pix *image = pixRead("D:/77.jpg");
api->SetImage(image);
// Get OCR result
outText = api->GetUTF8Text();
printf("OCR output:%s \n", outText);
system("pause");
// Destroy used object and release memory
api->End();
delete [] outText;
pixDestroy(&image);

return 0;

}

...全文

2731 7 打赏收藏转发到动态举报

写回复

7 条回复

切换为时间正序

请发表友善的回复…

发表回复

小忆K 2019-01-15

打赏
举报

回复

请问乱码怎么解决的我也遇到这样的问题了难受

传奇之后 2018-05-08

打赏
举报

回复

init之后需要调用SetVarible接口设置字符集

u012507022 2017-08-17

打赏
举报

回复

已解决http://blog.csdn.net/liulina603/article/details/45668307

u012507022 2017-08-16

打赏
举报

回复

遇到同样的问题，求解

yinhuzhao 2016-12-19

打赏
举报

回复

我也遇到同样的问题，请问楼主是怎么解决的?

luzkingforever 2015-04-27

打赏
举报

回复

请问楼主是怎么解决的??

qq40911462 2015-04-20

打赏
举报

回复 1

最后还是靠自己解决了，还有谁，结贴

本节课介绍在Android系统平台基于OpenCV与Tesseract-OCR框架实现对身份证号码识别技术为例，探讨移动平台上实际项目中OCR识别的常规处理流程与相关算法介绍

Tesseract的OCR作为一款字符识别的引擎，它最先是由惠普实验室于1985年开始研发，至1995年时已经成为OCR业内最准确的三款识别引擎之一。后来，HP不久便决定放弃OCR业务，Tesseract也从此尘封。数年以后，HP意识到，与其将Tesseract束之高阁，不如贡献给开源软件业，让其重焕新生。在2005年，Tesseract由美国内华达州信息技术研究所获得，并委托Google对其进行...

OCR(Optical Character Recognition)：光学字符识别，是指对图片文件中的文字进行分析识别，获取的过程。 Tesseract：开源的OCR识别引擎，初期Tesseract引擎由HP实验室研发，后来贡献给了开源软件业，后经由Google进行改进，消除bug，优化，重新发布。项目地址：https://github.com/tesseract-ocr 本文使用最新版本Tes...

目录需求背景 Tesseract简介及环境搭建字库训练 Tesseract for iOS 总结需求背景由于客户端内核的限制，市场上大多数身份证识别都会放在服务器校验，客户端一般只是负责抓取图片，将抓取到的图片上送到服务器识别。这样一来如果客户端抓取到的身份证图片的质量无法保障，服务器也很难识别得出来，会拖慢身份证识别进程，造成用户...

首先需要说明的是，windows下的文件路径，cmd窗口等默认编码都是gbk但在windows下编写python程序的时候，我们一般采用的编码是utf-8二者不一致是导致乱码的根本原因！在pycharm下，为了中文不乱码，那么需要注意一下几个方面：一、每一个源程序文件头部，需要加上#-*-coding:utf-8-*-二、pycharm每个文件的编码设置，需要设置为utf-8（注意下图右下方的红框...

4,446

社区成员

15,335

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章