在自主研发一个OCR,每天和大家讨论一点问题

哎,真难 2016-07-13 06:23:16
加精
OCR这个深坑看来是跳定了,那么每天和大家探讨一下,弄不好我们就能一起研究出来一个牛逼的东西来了
今天的第一个问题:获取图片,图片中的文字是分行的,每行下面有下划线,如何获取到那个下划线的位置,并根据下划线去切分图片
...全文
1817 67 打赏 收藏 转发到动态 举报
写回复
用AI写文章
67 条回复
切换为时间正序
请发表友善的回复…
发表回复
qingye2008 2016-07-21
  • 打赏
  • 举报
回复
引用 56 楼 heaimnmn 的回复:
[quote=引用 55 楼 qingye2008 的回复:] 1) 开源的自动识别好像没有比较好的 2) 建议使用opencv 3) 图像二值化,建议使用积分查找,不要自己设置阀值 4) 图像灰度 5) 根据图像查找轮廓 6) 轮廓面积帅选 7) 对所查找的轮廓进行自定义矩形定义 8) 裁剪热点 9) 制作大量样本 10) 对大量样本进行训练cvsvm 11) 最后将训练样本的结果xml用于识别. 12) 注意样本图片长度和高度最好为 4 的整数,便于识别的时候,有个滑动窗口概念,好像是这么理解. 13) 请参考<<OpenCV3编程入门>>
这个有个问题,拍照针打的东西,查找轮廓以后,中间部分会是空心,造成的扫描问题,请问下怎么处理[/quote] 应该是你的图像二值化的时候不均衡. 你贴图上来看看情况
哎,真难 2016-07-19
  • 打赏
  • 举报
回复
引用 65 楼 zanfeng 的回复:
把妹版主,也搞这技术了
我一直搞技术
足球中国 2016-07-19
  • 打赏
  • 举报
回复
把妹版主,也搞这技术了
IT行业学习者 2016-07-18
  • 打赏
  • 举报
回复
没学过,貌似很厉害的样子啊
奥巴荣 2016-07-16
  • 打赏
  • 举报
回复
我帮同学做个一个简单的身份证号码识别OCR,用MATLAB的,要的话可以发给你参考。 用MATLAB可以马上看到处理效果,对于初学者来说效率比较高,方便学思路,资源也多。 OCR一般思路:RGB图-灰度图-黑白图-反色-去噪点-旋转-切割-识别。 顺序可能有点出入但是问题不大,识别功能要拿10个数字的图片去做机器学习。
猴头 2016-07-16
  • 打赏
  • 举报
回复
弄不好我们就能一起研究出来一个牛逼的东西来 OpenAV
madcat0708 2016-07-15
  • 打赏
  • 举报
回复
学习下,混点下载币。
哎,真难 2016-07-15
  • 打赏
  • 举报
回复
引用 51 楼 u010909114 的回复:
引用 50 楼 u010909114 的回复:
[quote=引用 49 楼 heaimnmn 的回复:] [quote=引用 48 楼 u010909114 的回复:] [quote=引用 46 楼 heaimnmn 的回复:] [quote=引用 45 楼 u010909114 的回复:] [quote=引用 44 楼 heaimnmn 的回复:] [quote=引用 43 楼 u010909114 的回复:] 光学字符识别,用Halcon做比较好实现,但那软件收费的。
现在自主研发一个试试
你可看看他们实现的大概思路,这样实现起来,比较快点。个人观点。[/quote]源码都没有,怎么看。。。[/quote] 我有些源码例子,但也是基于Halcon开发的算子,也就是Halcon开发环境自带的例程,但可能你对Halcon不了解,对其中 的算子也就不好理解了。(当然Halcon中算子的源码我是没有哦。)[/quote]共享源码看看咯[/quote] 不知道截图中是否是你想要的结果。如果你要源码,你可以下载安装过Halcon开发环境,里面就有例程,我可以提供license给你 [/quote][/quote]这不是,这是运行过程
fkueali 2016-07-15
  • 打赏
  • 举报
回复
大家可以一起探讨一下思路
花开花折 2016-07-15
  • 打赏
  • 举报
回复
引用 50 楼 u010909114 的回复:
引用 49 楼 heaimnmn 的回复:
[quote=引用 48 楼 u010909114 的回复:]
[quote=引用 46 楼 heaimnmn 的回复:]
[quote=引用 45 楼 u010909114 的回复:]
[quote=引用 44 楼 heaimnmn 的回复:]
[quote=引用 43 楼 u010909114 的回复:]
光学字符识别,用Halcon做比较好实现,但那软件收费的。
现在自主研发一个试试


你可看看他们实现的大概思路,这样实现起来,比较快点。个人观点。[/quote]源码都没有,怎么看。。。[/quote]

我有些源码例子,但也是基于Halcon开发的算子,也就是Halcon开发环境自带的例程,但可能你对Halcon不了解,对其中 的算子也就不好理解了。(当然Halcon中算子的源码我是没有哦。)[/quote]共享源码看看咯[/quote]

不知道截图中是否是你想要的结果。如果你要源码,你可以下载安装过Halcon开发环境,里面就有例程,我可以提供license给你


[/quote]
花开花折 2016-07-15
  • 打赏
  • 举报
回复
引用 49 楼 heaimnmn 的回复:
引用 48 楼 u010909114 的回复:
[quote=引用 46 楼 heaimnmn 的回复:]
[quote=引用 45 楼 u010909114 的回复:]
[quote=引用 44 楼 heaimnmn 的回复:]
[quote=引用 43 楼 u010909114 的回复:]
光学字符识别,用Halcon做比较好实现,但那软件收费的。
现在自主研发一个试试


你可看看他们实现的大概思路,这样实现起来,比较快点。个人观点。[/quote]源码都没有,怎么看。。。[/quote]

我有些源码例子,但也是基于Halcon开发的算子,也就是Halcon开发环境自带的例程,但可能你对Halcon不了解,对其中 的算子也就不好理解了。(当然Halcon中算子的源码我是没有哦。)[/quote]共享源码看看咯[/quote]

不知道截图中是否是你想要的结果。如果你要源码,你可以下载安装过Halcon开发环境,里面就有例程,我可以提供license给你


哎,真难 2016-07-15
  • 打赏
  • 举报
回复
引用 48 楼 u010909114 的回复:
引用 46 楼 heaimnmn 的回复:
[quote=引用 45 楼 u010909114 的回复:] [quote=引用 44 楼 heaimnmn 的回复:] [quote=引用 43 楼 u010909114 的回复:] 光学字符识别,用Halcon做比较好实现,但那软件收费的。
现在自主研发一个试试
你可看看他们实现的大概思路,这样实现起来,比较快点。个人观点。[/quote]源码都没有,怎么看。。。[/quote] 我有些源码例子,但也是基于Halcon开发的算子,也就是Halcon开发环境自带的例程,但可能你对Halcon不了解,对其中 的算子也就不好理解了。(当然Halcon中算子的源码我是没有哦。)[/quote]共享源码看看咯
花开花折 2016-07-15
  • 打赏
  • 举报
回复
引用 46 楼 heaimnmn 的回复:
引用 45 楼 u010909114 的回复:
[quote=引用 44 楼 heaimnmn 的回复:] [quote=引用 43 楼 u010909114 的回复:] 光学字符识别,用Halcon做比较好实现,但那软件收费的。
现在自主研发一个试试
你可看看他们实现的大概思路,这样实现起来,比较快点。个人观点。[/quote]源码都没有,怎么看。。。[/quote] 我有些源码例子,但也是基于Halcon开发的算子,也就是Halcon开发环境自带的例程,但可能你对Halcon不了解,对其中 的算子也就不好理解了。(当然Halcon中算子的源码我是没有哦。)
losecy1994z7z8 2016-07-15
  • 打赏
  • 举报
回复
新手 混点下载币
qq_35616976 2016-07-15
  • 打赏
  • 举报
回复
告诉在民间啊 啊 啊
哎,真难 2016-07-15
  • 打赏
  • 举报
回复
引用 45 楼 u010909114 的回复:
引用 44 楼 heaimnmn 的回复:
[quote=引用 43 楼 u010909114 的回复:] 光学字符识别,用Halcon做比较好实现,但那软件收费的。
现在自主研发一个试试
你可看看他们实现的大概思路,这样实现起来,比较快点。个人观点。[/quote]源码都没有,怎么看。。。
花开花折 2016-07-15
  • 打赏
  • 举报
回复
引用 44 楼 heaimnmn 的回复:
引用 43 楼 u010909114 的回复:
光学字符识别,用Halcon做比较好实现,但那软件收费的。
现在自主研发一个试试
你可看看他们实现的大概思路,这样实现起来,比较快点。个人观点。
哎,真难 2016-07-15
  • 打赏
  • 举报
回复
引用 43 楼 u010909114 的回复:
光学字符识别,用Halcon做比较好实现,但那软件收费的。
现在自主研发一个试试
花开花折 2016-07-15
  • 打赏
  • 举报
回复
光学字符识别,用Halcon做比较好实现,但那软件收费的。
assky124 2016-07-15
  • 打赏
  • 举报
回复
收藏,最近也准备搞下图像识别
加载更多回复(41)
计算机视觉(Computer Vision)又称为机器视觉(Machine Vision),顾名思义是一门“教”会计算机如何去“看”世界的学科。在机器学习大热的前景之下,计算机视觉与自然语言处理(Natural Language Process, NLP)及语音识别(Speech Recognition)并列为机器学习方向的三大热点方向。在如今互联网时代,人工智能发展迅速,计算机视觉领域应用非常广泛,对人才的需求也是非常大,计算机视觉在IT领域的工资水平非常高,初级就能达到一个很好的薪资水平,学好计算机视觉,势在必得,增加自己的竞争力以及给自己一个好的薪水。 以下是计算机视觉部分应用场景,可以看到它的需求非常大:1.Google, MS, Facebook, Apple,华为,阿里,腾讯,百度等世界科技公司,无一没有建立自己的AI实验室,AI里面,计算机视觉或图像处理是非常重要的一块,当然它们研究方向就多了,几乎会涵盖所有方向。2.世界各大汽车公司,如特斯拉,宝马。汽车公司开始发力自动驾驶,而自动驾驶里面最核心的技术就是“教”汽车里的电脑如何通过摄像头实时产生的图片和视频自动驾驶。因此视觉和图像处理便是核心技术所在,如行人探测,道路识别,模式识别。3.Adobe,美图秀秀等照片、winrar、real player等视频处理、压缩软件。这个不多说,直观的应用,比如降噪,图像分割、图像压缩、视频压缩。4.AR(增强现实)最近由于Pockman GO的风靡全球又被推到第一线,而Google Class或者三星Gear眼镜等等,也无不和图像处理、计算机视觉的科研有关。预测这将是未来几年主推的东西。5.迪士尼等各大电影制片公司。3-D电影,以及各种炫酷的电影特效,当然里面不光有图像处理,还有计算机图形学的东西在里面。6.地平线,大疆无人机等机器人公司。和自动驾驶一个道理,机器人要通过摄像头“判断”并躲开前方障碍物,核心技术都在视觉和图像处理。7.医疗器械设备公司。医学图像处理,核磁共振,断层扫描等等,众所周知医疗行业都是暴利阿。8.工业级摄像头;包括高速路上的摄像头,机场火车站安检摄像头,工业流水线上的摄像头,嵌入了人脸或次品识别的芯片,智能地识别罪犯、次品,等等。 基于SpringBoot+Python多语言文档扫描处理和OCR识别系统,将以基础知识为根基,带大家完成一个强大的文档扫描处理和OCR识别系统,该系统将包含算法部分,算法服务,算法商业化api部分等。应用场景可以为:爬虫图片文字识别、文档图片自动整理和输出文字、实时扫描输出系统、PDF文档转换系统等等,算法可以商业化,系统同时实现了商业化api功能,商业价值非常高,大家可以基于课程项目的基础上进一步完善,做到商用,学到知识的同时,给自己额外增加收入。 本课程包含的技术: 开发工具为:IDEA、WebStorm、PyCharmPythonAnconaOpencvDjangoSpringBootSpringCouldVue+ElementUI+NODEJS等等 课程亮点: 1.与企业接轨、真实工业界产品2.强大的计算机视觉库OPENCV3.从基础到案例,逐层深入,学完即用4.市场主流的前后端分离架构和人工智能应用结合开发5.多语言结合开发,满足多元化的需求6.商业化算法api实现7.多Python环境切换8.微服务SpringBoot9.集成SpringCloud实现统一整合方案 10.全程代码实操,提供全部代码和资料 11.提供答疑和提供企业技术方案咨询

80,351

社区成员

发帖
与我相关
我的任务
社区描述
移动平台 Android
androidandroid-studioandroidx 技术论坛(原bbs)
社区管理员
  • Android
  • yechaoa
  • 失落夏天
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧