tesseract 3.02识别汉字的问题方面的问题

英明决策 2013-04-24 03:31:19
我是一个tesseract方面的菜鸟,最近想通过tesseract3.02来识别图片中的文字,但是我的代码当调用“eng.traindata”库时对图片上的英文有很好的识别效果,但是调用“chi_sim.traindata”文字库时识别图片上的汉字都是乱码。希望大家能够帮助我,谢谢大家了。


代码:
#include "stdafx.h"
#include "baseapi.h"
#include "strngs.h"
int _tmain(int argc, _TCHAR* argv[])
{
const char * image = "image1.jpg";
tesseract::TessBaseAPI api;
//api.Init(NULL, "eng", tesseract::OEM_TESSERACT_ONLY);//识别英文
api.Init(NULL, "chi_sim", tesseract::OEM_TESSERACT_ONLY);//识别汉字
STRING text_out;
if (!api.ProcessPages(image, NULL, 0, &text_out))
{
printf("Can not read this picture!!!");
return 0;
}
printf(text_out.string());
getchar();
return 0;
}
...全文
793 10 打赏 收藏 转发到动态 举报
写回复
用AI写文章
10 条回复
切换为时间正序
请发表友善的回复…
发表回复
ZhanCF 2015-10-30
  • 打赏
  • 举报
回复
引用 1 楼 zhao4zhong1 的回复:
#include <locale.h> setlocale(LC_ALL,"chs"); 对电脑而言没有乱码,只有二进制字节;对人脑才有乱码。啊 GBK:0xB0 0xA1,Unicode:0x4A 0x55,UTF-8:0xE5 0x95 0x8A
赵老师无处不在~
sunjunlishi 2014-02-24
  • 打赏
  • 举报
回复
me,too
ceijiajia 2014-01-16
  • 打赏
  • 举报
回复


我也遇到这个问题,如何解决啊?求大神指点
大O江湖 2013-12-12
  • 打赏
  • 举报
回复
tesseract,首先训练,累级训练三到四次,生成自己的文字样本,如果你会编程的话,先对图像进行白底黑字二值化处理。
yzsyb 2013-12-02
  • 打赏
  • 举报
回复
我也有too many unichars in ambiguity on line *** 这个问题,没找到原因和方法 有知道的高手求指点
神-气 2013-10-28
  • 打赏
  • 举报
回复
引用 4 楼 GAOYANGAOYANGAOYAN 的回复:
你好,请问你问题解决了吗?我识别出来也遇到了跟你一样的问题不知道怎么回事呢,如果解决了,麻烦说下呢
这个输出的字符串是utf-8编码的,你可以在记事本里面用utf-8格式查看。
GAOYANGAOYANGAOYAN 2013-09-29
  • 打赏
  • 举报
回复
你好,请问你问题解决了吗?我识别出来也遇到了跟你一样的问题不知道怎么回事呢,如果解决了,麻烦说下呢
夏梦c 2013-07-31
  • 打赏
  • 举报
回复
识别的结果要进行转码
英明决策 2013-04-25
  • 打赏
  • 举报
回复
你好,谢谢你的帮助。不过我还是不太明白为什么会出现too many unichars in ambiguity on line 2748432,这是因为我用的查找英文的方式开搜索汉字字库吗?
赵4老师 2013-04-24
  • 打赏
  • 举报
回复
#include <locale.h> setlocale(LC_ALL,"chs"); 对电脑而言没有乱码,只有二进制字节;对人脑才有乱码。啊 GBK:0xB0 0xA1,Unicode:0x4A 0x55,UTF-8:0xE5 0x95 0x8A

64,654

社区成员

发帖
与我相关
我的任务
社区描述
C++ 语言相关问题讨论,技术干货分享,前沿动态等
c++ 技术论坛(原bbs)
社区管理员
  • C++ 语言社区
  • encoderlee
  • paschen
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
  1. 请不要发布与C++技术无关的贴子
  2. 请不要发布与技术无关的招聘、广告的帖子
  3. 请尽可能的描述清楚你的问题,如果涉及到代码请尽可能的格式化一下

试试用AI创作助手写篇文章吧