关于OCR汉字识别的方法讨论

xmutbbs2 2013-01-21 09:30:30

最近在写一款文档识别软件，前期的图像预处理（倾斜校正，单字切割等）都已经完成，现在已经开始要对切割出来的单字进行识别，不知道要用何种方式进行，查了资料有的说用BP神经网络，有的说模板匹配。。请坛子里面的大佬指点迷津！！万分感激！

...全文

262 6 打赏收藏转发到动态举报

写回复

用AI写文章

6 条回复

切换为时间正序

请发表友善的回复…

发表回复

brazen__ 2013-09-29

打赏
举报

tesseract 匹配识别率很高，请教一下你写的那款文字识别软件中预处理的倾斜校正思路？

爱学习的大牛123 2013-01-29

打赏
举报

微软的office库好像有接口

zhouzhipen 2013-01-22

打赏
举报

最准确的方式是抽骨，再转化为笔画曲线信息，再从曲线信息库中匹配出相似度最高的。所谓的神经网络就是在其识别错误的情况下将其人为纠正，然后将纠正的数据保存。

jimette 2013-01-22

打赏
举报

codeproject有好多文字识别的

fengbingchun 2013-01-22

打赏
举报

既然已经切割出单字符了，直接应用开源的tesseract-ocr就可以 http://blog.csdn.net/fengbingchun/article/details/8493877

xmutbbs2 2013-01-22

打赏
举报

引用 1 楼 zhouzhipen 的回复:

最准确的方式是抽骨，再转化为笔画曲线信息，再从曲线信息库中匹配出相似度最高的。所谓的神经网络就是在其识别错误的情况下将其人为纠正，然后将纠正的数据保存。

就是所谓的字符细化算法吗？

使用Java开发的OCR程序根据图像识别转换成中文

OCR验证码识别C#代码 OCR验证码识别C#代码 OCR验证码识别C#代码

ocr繁体中文识别补丁Microsoft Office Document Imaging

Tesseract-ocr 中文支持，图片上的中文文字解析，。。。。

java ocr图片识别，带Tesseract，带中文库

图形处理/算法

19,466

社区成员

50,678

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章