关于OCR汉字识别的方法讨论

xmutbbs2 2013-01-21 09:30:30
最近在写一款文档识别软件,前期的图像预处理(倾斜校正,单字切割等)都已经完成,现在已经开始要对切割出来的单字进行识别,不知道要用何种方式进行,查了资料有的说用BP神经网络,有的说模板匹配。。请坛子里面的大佬指点迷津!!万分感激!
...全文
224 6 打赏 收藏 转发到动态 举报
写回复
用AI写文章
6 条回复
切换为时间正序
请发表友善的回复…
发表回复
brazen__ 2013-09-29
  • 打赏
  • 举报
回复
tesseract 匹配识别率很高,请教一下你写的那款文字识别软件中预处理的倾斜校正思路?
zhangyihu321 2013-01-29
  • 打赏
  • 举报
回复
微软的office库好像有接口
zhouzhipen 2013-01-22
  • 打赏
  • 举报
回复
最准确的方式是抽骨,再转化为笔画曲线信息,再从曲线信息库中匹配出相似度最高的。所谓的神经网络就是在其识别错误的情况下将其人为纠正,然后将纠正的数据保存。
jimette 2013-01-22
  • 打赏
  • 举报
回复
codeproject有好多文字识别的
fengbingchun 2013-01-22
  • 打赏
  • 举报
回复
既然已经切割出单字符了,直接应用开源的tesseract-ocr就可以 http://blog.csdn.net/fengbingchun/article/details/8493877
xmutbbs2 2013-01-22
  • 打赏
  • 举报
回复
引用 1 楼 zhouzhipen 的回复:
最准确的方式是抽骨,再转化为笔画曲线信息,再从曲线信息库中匹配出相似度最高的。所谓的神经网络就是在其识别错误的情况下将其人为纠正,然后将纠正的数据保存。
就是所谓的字符细化算法吗?
第1章 数字图像与图像处理 1 1.1 数字图像相关概念 1 1.1.1 数字图像 1 1.1.2 图像处理 2 1.1.3  图像识别 2 1.1.4 图像理解 3 1.2 图像的获取、显示与表示 3 1.2.1 图像的获取 3 1.2.2 图像显示 4 1.2.3 图像表示 4 1.3 数字图像处理系统的基本组成结构 9 第2章 相关的图像处理技术 10 2.1  图像分割技术 10 2.1.1 阈值与图像分割 10 2.1.2 梯度与图像分割 11 2.1.3 边界提取与轮廓跟踪 11 2.1.4  Hough变换 12 2.1.5 区域增长 12 2.2 图像复原 12 2.2.1 数学模型 12 2.2.2 维纳滤波(Wiener Filtering) 13 2.3 图像的纹理分析技术 13 2.3.1 空间灰度层共现矩阵 14 2.3.2  纹理能量测量 16 2.3.3 纹理的结构分析方法和纹理梯度 18 2.3.4 纹理识别示例——云类自动识别 19 2.4 图像的形态学处理技术 20 2.4.1 基本概念 21 2.4.2 开运算和闭运算 22 2.4.3 击中、击不中、变换 (HMT-Hit Miss Transform) 23 2.4.4 边界和骨架(Boundary and Skeleton) 23 第 3章 指纹识别系统(上) 24 3.1 指纹识别的历史 24 3.2 指纹识别研究的现状 24 3.3 指纹识别系统的构成  25 3.3.1 指纹的录入 26 3.3.2 指纹图像增强 28 3.3.3 指纹识别的基本原理 29 3.3.4  系统问题 30 3.3.5 系统性能评估 31 3.3.6 一套指纹识别算法库的构成 32 3.4 指纹的粗分类与匹配 89 3.5  基于Matlab的指纹识别系统 92 3.5.1 主界面程序 93 3.5.2 指纹中心计算程序 115 3.5.3 计算有效区域 117 3.5.4 二维Gabor变换 118 3.5.5 归一化扇区 119 3.5.6 读取图像 120 3.5.7  旋转角度计算 121 第4章 指纹识别系统(下) 123 4.1 指纹图像的预处理 123 4.1.1 预处理概述  123 4.1.2 指纹质量评估 124 4.1.3 指纹图像分割 129 4.1.4 指纹图像增强 134 4.1.5  指纹图像二值化 135 4.1.6 指纹图像细化 136 4.1.7 相关预处理算法代码 139 4.2 指纹特征提取  177 4.2.1 指纹特征的表述 177 4.2.2 局部细节特征提取 180 4.2.3 特征提取算法代码 186 4.3  基于点模式的细节匹配 194 4.4 指纹识别的实际应用案例 204 4.4.1 指纹门禁系统 204 4.4.2 指纹考勤系统 205 4.5 指纹处理算法库测试程序 206 4.6 本章小结 218 第5章 数字水印技术 219 5.1  基本概念 219 5.1.1 水印技术的基本要求 219 5.1.2 数字水印算法基本思路 219 5.1.3 一些关键问题 220 5.2 水印应用现状分析 220 5.2.1 现有水印算法不适应版权保护 220 5.2.2 盲检测算法 222 5.2.3  盲检测算法的公证 222 5.2.4 数字水印系统的一般组成 223 5.3 基于DCT域的数字水印方案 223 5.3.1  离散余弦变换 223 5.3.2 Torus自同构映射 224 5.3.3 人眼视觉频率响应及DCT变换系数的选取 224 5.3.4  水印算法 226 5.4 基于扩频通信的水印算法 228 5.4.1 扩频通信原理 228 5.4.2 扩频通信在数字水印中的利用 229 5.4.3 加载强度的讨论 233 5.4.4 水印加载算法的实现 237 5.5 一个基于DCT域的实例  240 5.5.1 一些算法代码 240 5.5.2 加载水印 271 5.5.3 提取水印 275 5.5.4 水印算法评价 281 5.6 本章小结 294 第6章 条形码技术 295 6.1 常用的条码编码规则 295 6.1.1  条码的一般组成 295 6.1.2 条码的种类 296 6.1.3 EAN-13码的构造 296 6.2 一个简单的条形码打印系统 298 6.3 一维条形码的识别 312 6.3.1 硬件识别系统 312 6.3.2 预处理过程 312 6.3.3  译码过程 314 6.4 一维条形码识别系统实例 315 6.4.1 DIB.H位图存取头文件 316 6.4.2  DIB.CPP位图存取源程序 317 6.4.3 BARRECOG.H条码识别头文件 322 6.4.4 BARRECOG.CPP条码识别源程序 323 6.5 二维条形码介绍 337 6.5.1 PDF417符号的结构 338 6.5.2 簇及符号字符定义 338 6.5.3 层编码 339 6.5.4 模式结构 339 6.5.5 起始符和终止符 340 6.5.6  空白区 340 6.5.7 错误监测与纠正 340 6.6 二维条形码打印程序 340 6.6.1 PDF417LIB.H二维条形码库头文件 340 6.6.2 PDF417LIBIMP.H数据定义 342 6.6.3 PDF417LIB.C函数实现文件  353 6.6.4 PDF417.C主程序 377 6.7 本章小结 378 第7章 手势识别系统 379 7.1  立体测量 379 7.1.1 立体匹配法 379 7.1.2 立体视觉的原理 379 7.1.3 用立体视觉进行距离测量  381 7.2 用一台摄像头进行距离测量 382 7.2.1 摄像头正对前方 382 7.2.2 摄像头倾斜 383 7.2.3  一台摄像头测量距离 385 7.3 假想演奏系统的构成 387 7.3.1 系统概述 387 7.3.2 肤色提取 388 7.3.3  右手位置检测 390 7.3.4 摄像机的距离测量 391 7.3.5 音阶范围与音量范围 391 7.3.6 声音的表现方法 392 7.3.7 系统整体构成 393 7.4 程序代码 393 7.5 本章小结 432 第8章 印鉴鉴定系统 433 8.1 伪印鉴的制作及人工防伪技术 433 8.1.1 常用伪造印鉴的方法及其特征 433 8.1.2 真假印鉴印文的检验 435 8.2 印鉴图像的分离 435 8.2.1 封闭凸多边形图像提取的算法提出 436 8.2.2 封闭凸多边形图像的提取方法——种子扩散浮置实体算法 436 8.3 基于矩不变量的印鉴识别 439 8.4 基于Fourier描述符的印鉴识别方法 441 8.4.1 提取字符包络线 441 8.4.2 字符包络线的Fourier描述 442 8.5 基于边缘和模板匹配的印鉴识别 443 8.6 部分算法代码 446 8.6.1 背景去除(利用颜色) 446 8.6.2 基于矩不变量的代码 450 8.7 本章小结 455 第9章 光学字符识别技术(上) 456 9.1 概述 456 9.1.1 文字识别系统的构成 456 9.1.2 文字识别技术 457 9.1.3 印刷体汉字识别 459 9.1.4 存在的问题 461 9.2  预处理技术 461 9.2.1 二值化 462 9.2.2 版面分析 463 9.2.3 倾斜度校正 464 9.2.4  版面切分 467 9.2.5 行、字分割 467 9.2.6 细化和规范化 469 9.2.7 预处理算法源代码示例 470 9.3  特征提取 537 9.3.1 概述 538 9.3.2 边缘跟踪 538 9.3.3 笔画的分类 540 9.3.4 笔画识别前的噪声处理 541 9.3.5 笔画方向码合并处理及笔画识别 542 9.3.6 笔画间特征量的定义及识别 543 9.3.7  整字匹配的距离准则 544 9.3.8 一些统计特征 545 第10章 光学字符识别技术(下) 549 10.1 分类与识别 549 10.1.1 判别器的选择 549 10.1.2 决策树的基本概念 550 10.1.3 决策树设计 552 10.1.4  节点分类器设计 555 10.1.5 多方案组合识别器 558 10.1.6 代码示例 560 10.2 后处理 623 10.3  OCR程序示例 639 10.4 本章小结 640
比这个帖子多了 OCR识别后的 结果。 http://download.csdn.net/source/2312218 无线电电子电路制作(图解趣味电子制作) 如果您看到本PDF,请发邮件给 21504965@qq.com,让我知道我的付出没有白费。谢谢! 自制GPS群:19504537 (电台(短波)+GPS(GPRS选配)+陀螺仪(MEMS)) 本项目征集 志愿者: 1、工程师:硬件/软件/模具(外壳) 2、VC:疑似头脑简单型。本项目暂时看不到盈利的希望。 3、测试者。喜欢户外的同学,测试产品,写测试报告,提供产品的建议和意见。 缘起:当户外邂逅工程师 现实中,难于让人理解自己,于是开始了户外活动。 一番辗转,来到了磨房。 由于方向感差,借助GPS。 但是对于手持GPS不满意: 1、便宜的有二手Lowrance。只有英文版的,由于是二手的,不知道那一天就挂了。 2、麦哲伦和高明的都是2000¥起价的。 3、车载GPS基本上都不支持轨迹导航(KML格式或者可以转换为KML格式),不支持等高线。 4、派特风只是一个玩具,价格还比较高。(不支持等高线) 于是决定自己做一个。 搜索到了: http://bbs.21ic.com/icview-119539-1-1.html 本人DIY的手持GPS~~~~ 它的GPS支持轨迹导航,做出了一个雏形。不想从头开始,就想找楼主要源代码。 看楼主 sun68 的个人资料: 自我介绍: 淘宝: http://shop59878916.taobao.com/ 个人网站: http://OurSTM.5d6d.com 进入了它的群:奋斗STM32讨论QQ群: 42465044(2009-12-20) 找到了群猪的QQ:9191274 和他商定,买他的开发板,给源代码。于是就有了压缩包中的 9191274-DIYGPSsun68.7z。 他说他本来想移植到 ARM 的,由于工作忙(业余去做ARM开发板了。) 于是说,我会在将来移植到 ARM 的。 由于板子以Si Labs的C8051F120为MCU,以 ST7565P12864-28(128X64点)为显示元件,于是上 TAOBAO 找C8051F120的开发板,找支持汉字库的12864点阵屏幕。以理解本程序。 开发板最后找到了 新华龙电子有限公司:http://www.xhl.com.cn/ 130¥ 卓越上面找到: 无线电电子电路制作(图解趣味电子制作) 作者:(日本)大久保忠 http://www.amazon.cn/ 扫描仪用的是新买的 清华紫光Uniscan A686。330¥ PHOTOSHOP 用的是 简体中文 v5.0.2 版本。 选用 初级模式 中的 文字识别 模式。 本模式扫描一页大概要 30秒钟,可以知道我付出的劳动。 存储为 BMP 图片格式(600M),由于体积太大,为了防止以后要识别它,就用 汉王PDF OCR 8.1.0.3 来识别为TXT文件。TXT文件没有经过校对。 最后,使用 FreePic2Pdf.exe V1.26 来生成 PDF 了。 GPS的打算: 10米电台:比 U段/V段(0.7米/2米)的波长要长,理论上在户外传播的远。 具体参考: http://www.gogojm.com/bbs/viewthread.php?tid=26980 小型背负式短波电台随想 带数据传输功能,用来在队友之间(留守人员)传输坐标。 电台的合作伙伴:BG3EE。 带 MEMS陀螺仪的GPS:采用高灵敏度的GPS模块。由于在山谷的时候没有GPS信号,或者GPS信号漂移大,准备使用 深迪的 MEMS陀螺仪来校正:MEMS惯性测量单元(六轴) - S4400 http://www.senodia.com/cn/index.php?option=com_content&view=article&id=8&Itemid=9 地图:支持 MP 格式的等高线地图。 显示部分打算采用 ILI9320 控制的 320×240 的 TFT屏幕(手机屏幕),3英寸左右。 MCU第一版采用 STC 的8051系列,第二版采用ST的ARM:STM32F103VET6TR。 同时关注 Energy Micro 的 EFM 32 Gecko 系列的ARM。

19,468

社区成员

发帖
与我相关
我的任务
社区描述
VC/MFC 图形处理/算法
社区管理员
  • 图形处理/算法社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧