tesseract-ocr训练字库出错

lllgggglt 2014-10-21 09:28:51
搜到的所有训练步骤都是以下这个顺序,每次做到第二步就错了,显示参数没有找到?

生成box文件,然后在编辑器jtessboxeditor里修改,然后save以下,进行train文件生成就会得到这个返回
大神帮忙看看是什么原因啊?
*****************************************************************************************************************
1、tesseract image.MyFont.exp0.tif image.MyFont.exp0 -l chi_sim batch.nochop makebox
该步骤会生成一个image.MyFont.exp0.box文件
把tif文件和box文件放在同一目录,用jTessBoxEditor.jar打开tif文件,然后根据实际情况修改box文件
2、tesseract image.MyFont.exp0.tif image.MyFont.exp0 nobatch box.train
该步骤生成一个image.MyFont.exp0.tr文件
3、unicharset_extractor image.MyFont.exp0.box
该步骤生成一个unicharset文件
4、新建一个font_properties文件
里面内容写入MyFont 0 0 0 0 0 表示默认普通字体
5、运行命令
shapeclustering -F font_properties -U unicharset image.MyFont.exp0.tr
mftraining -F font_properties -U unicharset -O image.unicharset image.MyFont.exp0.tr
cntraining image.MyFont.exp0.tr
6、把目录下的unicharset、inttemp、pffmtable、shapetable、normproto这五个文件前面都加上image.
7、执行combine_tessdata image.
然后把image.traineddata放到tessdata目录
8、用新的字库对图片进行分析
tesseract test.tif output -l image
...全文
1104 3 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
3 条回复
切换为时间正序
请发表友善的回复…
发表回复
yblchinastar 2015-08-18
  • 打赏
  • 举报
回复
将 nobatch 删除
kangzengrui 2015-07-27
  • 打赏
  • 举报
回复
需要安装tesseract, 不安装就存在该问题(环境变量设置相关)。
tuling56 2015-04-29
  • 打赏
  • 举报
回复
http://blog.csdn.net/tuling_research/article/details/41091163

19,473

社区成员

发帖
与我相关
我的任务
社区描述
VC/MFC 图形处理/算法
社区管理员
  • 图形处理/算法社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧