tesseract ocr中文字库乱码求助

qq_16185751 2014-06-07 12:05:44
用opencv和ocr写了个小程序,但是中文字库识别全是乱码,求大牛指点一下
//OCR
tesseract::TessBaseAPI api;
api.Init("D:\\tesseract302\\tesseract302\\tessdata", "chi_sim1");
//OpenCV Process
IplImage *frame = cvCreateImage(cvSize(640, 480), IPL_DEPTH_8U, 3);
cvZero(frame);
char key = 0;
p0.x = p0.y = 0;
p1.x = p1.y = 0;
fingertip.x = fingertip.y = 0;
while (key != ' ')
{
p0 = p1;
p1 = fingertip;
if (p0.x & p0.y & p1.x & p1.y)
cvDrawLine(frame, p1, p0, cvScalar(255, 255, 255), 2);
//std::cout << p0.x << p0.y << p1.x << p1.y<<endl;
cvShowImage("ShowImage", frame);
key = cvWaitKey(10);

if (key == 's')
{
cvSaveImage("frame.jpg", frame);
api.SetImage((unsigned char*)(frame->imageData), frame->width, frame->height, frame->nChannels, frame->widthStep);
char* text = api.GetUTF8Text();
cout << text << endl;
cout << "Press any key to continue..." << endl;
key = cvWaitKey(0);
}
...全文
2454 1 打赏 收藏 转发到动态 举报
写回复
用AI写文章
1 条回复
切换为时间正序
请发表友善的回复…
发表回复
SilversHHH 2016-11-26
  • 打赏
  • 举报
回复
加一个utf8转ansi的函数。我之前也是这个问题研究了好久,最后用notepad改了改编码发现了。c的输入默认是ansi编码的,这个识别出来的是utf8

6,721

社区成员

发帖
与我相关
我的任务
社区描述
专题开发/技术/项目 Google技术社区
社区管理员
  • Google技术社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧