社区
Web 开发
帖子详情
谁有中文识别率高的训练包??
不关橙猫猫事的哦
2020-12-18 09:47:12
目前用的是tess4j,网上下的chi_sim.traineddata有50MB左右,识别率非常低,想自己训练又没时间,公司也安排不出人手。有没有识别率高的,90%左右就行,可以申请让公司出钱买。
不考虑百度、阿里、腾讯的在线识别服务,因为客户的服务器不允许连接外网,跟企业审计相关的涉密服务器没办法。
...全文
3544
4
打赏
收藏
谁有中文识别率高的训练包??
目前用的是tess4j,网上下的chi_sim.traineddata有50MB左右,识别率非常低,想自己训练又没时间,公司也安排不出人手。有没有识别率高的,90%左右就行,可以申请让公司出钱买。 不考虑百度、阿里、腾讯的在线识别服务,因为客户的服务器不允许连接外网,跟企业审计相关的涉密服务器没办法。
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
4 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
KeepSayingNo
2020-12-19
打赏
举报
回复
不用翻墙啊,就是github的,我都登录进去了
qybao
2020-12-18
打赏
举报
回复
这个还真不好弄,LZ有时间还是自己训练试试吧,挺折腾的
首先字体图片不好到手,其次要训练哪种字体也不好范围确定(比如需要宋体,楷体等),第三,训练文件好像对字体的最大类型有限值(我记得当时做的时候,超过60种字体就不支持(猜测是训练字体太多最后生成的字体文件size太大,所以做了限制,或许可以考虑按60种字体做成多个字体文件后再合并,当时没时间去深究了),所以说你需要什么字体你要定好),但是你要求的90%识别率,由于前面的限制条件,那就不好说了,比如识别的字体没有出现在你训练的字体里,有可能识别率为0。
不关橙猫猫事的哦
2020-12-18
打赏
举报
回复
引用 2 楼 KeepSayingNo 的回复:
用这个试试呢
https://github.com/tesseract-ocr/tesseract/wiki
这个要翻墙吗,访问不得呢
KeepSayingNo
2020-12-18
打赏
举报
回复
用这个试试呢
https://github.com/tesseract-ocr/tesseract/wiki
【Ai-人工智能计算机视觉/人脸识别】HyperLRP基于深度学习
高
性能
中文
车牌识别开源库
Q:Android
识别率
没有所传demo apk的
识别率
高
? A:请使用Prj-Linux下的模型,android默认
包
里的配置是相对较早的模型 Q:车牌的
训练
数据来源? A:由于用于
训练
车牌数据涉及到法律隐私等问题,本项目无法提供。...
HyperLPR:基于深度学习的
高
级
中文
车牌识别
高
性能
中文
车牌识别框架
问:Android
识别率
没有所传demo apk的
识别率
高
? A:请使用下的模型,android默认
包
里的配置是相对较早的模型 问:车牌的
训练
数据来源? A:由于相关
训练
车牌数据涉及到法律隐私等问题,本项目无法提供。开放大的...
一亿ID的人脸识别
训练
和万亿人脸对(Trillion Pairs)的人脸识别评测
本课程首先会带大家一起回顾下人脸识别的问题定义、历史...后会宣布一个比赛,这个比赛不仅提供了标注更准确的大规模人脸
训练
数据集, 而且也提供了一个非常有挑战性且可以支持超低误
识别率
(千亿分之一)的线上评测。
使用tesseract
训练
自己的字库提
高
识别率
问题描述:想使用tesseract识别
中文
,但是发现有一个字tesseract自带的库会识别错误或者不识别。比如下图的左图,其结果是“肇”变成“告”,明显是识别错了。但是如果将“肇”单独去识别,会发现根本识别不出,结果...
图像文字识别(三):Tesseract4.0
训练
字库,提
高
正确
识别率
由于tesseract的
中文
语言
包
“chi_sim”对
中文
手写字体或者环境比较复杂的图片,识别正确率不
高
,因此需要针对特定情况用自己的样本进行
训练
,提
高
识别率
,通过
训练
,也可以形成自己的语言库。 步骤: 1、工具...
Web 开发
81,091
社区成员
341,719
社区内容
发帖
与我相关
我的任务
Web 开发
Java Web 开发
复制链接
扫一扫
分享
社区描述
Java Web 开发
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章