关于OCR汉字识别的方法讨论

xmutbbs2 杭州大真科技 项目经理  2013-01-21 09:30:30
最近在写一款文档识别软件,前期的图像预处理(倾斜校正,单字切割等)都已经完成,现在已经开始要对切割出来的单字进行识别,不知道要用何种方式进行,查了资料有的说用BP神经网络,有的说模板匹配。。请坛子里面的大佬指点迷津!!万分感激!
...全文
183 6 点赞 打赏 收藏 举报
写回复
6 条回复
切换为时间正序
当前发帖距今超过3年,不再开放新的回复
发表回复
brazen__ 2013-09-29
tesseract 匹配识别率很高,请教一下你写的那款文字识别软件中预处理的倾斜校正思路?
  • 打赏
  • 举报
回复
zhangyihu321 2013-01-29
微软的office库好像有接口
  • 打赏
  • 举报
回复
zhouzhipen 2013-01-22
最准确的方式是抽骨,再转化为笔画曲线信息,再从曲线信息库中匹配出相似度最高的。所谓的神经网络就是在其识别错误的情况下将其人为纠正,然后将纠正的数据保存。
  • 打赏
  • 举报
回复
jimette 2013-01-22
codeproject有好多文字识别的
  • 打赏
  • 举报
回复
fengbingchun 2013-01-22
既然已经切割出单字符了,直接应用开源的tesseract-ocr就可以 http://blog.csdn.net/fengbingchun/article/details/8493877
  • 打赏
  • 举报
回复
xmutbbs2 2013-01-22
引用 1 楼 zhouzhipen 的回复:
最准确的方式是抽骨,再转化为笔画曲线信息,再从曲线信息库中匹配出相似度最高的。所谓的神经网络就是在其识别错误的情况下将其人为纠正,然后将纠正的数据保存。
就是所谓的字符细化算法吗?
  • 打赏
  • 举报
回复
相关推荐
发帖
图形处理/算法
加入

1.9w+

社区成员

VC/MFC 图形处理/算法
申请成为版主
帖子事件
创建了帖子
2013-01-21 09:30
社区公告
暂无公告