被汉王郁闷了,谁有成熟的ocr sdk介绍

guyulf 2011-11-03 04:12:10
公司有个开发需求,需要对上传的文档类图片进行文字识别,然后存放到数据库里;

Tesseract-ocr下载测试过, 不管是处理速度还是针对汉字的解析能力都不能达到需求,

网上都说汉王是成熟产品,我也查了下汉王的这类资料, 发现针对手机名片识别的还是比较成熟的,也不知道能不能达到我的要求,最离谱的是打了2天的咨询电话没人接, 今天有人接了还直接给我挂掉了,真叫个窝火,

各位大拿们有什么好介绍,要钱的无所谓,反正是方案提交,客户埋单,不过开源的最好.
...全文
1001 3 打赏 收藏 转发到动态 举报
写回复
用AI写文章
3 条回复
切换为时间正序
请发表友善的回复…
发表回复
guyulf 2011-11-03
  • 打赏
  • 举报
回复
linux的系统啊,office带的东西用不了,而且也没测过效率
汉王本来就有sdk,只不过他网站上只发布了普通版的 6000多个汉字,针对的是手机终端名片识别业务的
赵4老师 2011-11-03
  • 打赏
  • 举报
回复
VERSION 5.00
Begin VB.Form Form1
Caption = "VB实现OCR文字识别"
ClientHeight = 3195
ClientLeft = 60
ClientTop = 345
ClientWidth = 4680
LinkTopic = "Form1"
ScaleHeight = 3195
ScaleWidth = 4680
StartUpPosition = 3 '窗口缺省
Begin VB.CommandButton Command1
Caption = "识别"
Height = 495
Left = 1800
TabIndex = 0
Top = 1320
Width = 1215
End
End
Attribute VB_Name = "Form1"
Attribute VB_GlobalNameSpace = False
Attribute VB_Creatable = False
Attribute VB_PredeclaredId = True
Attribute VB_Exposed = False
Option Explicit

Private Sub Command1_Click()
Dim strLayoutInfo As String
Dim miDoc As Object
Dim modiLayout As Object

'初始化并加载文档
Set miDoc = CreateObject("MODI.Document") '创建对象
miDoc.Create "z.tif" '加载图片文件

Screen.MousePointer = vbHourglass '设置光标忙
'识别
miDoc.Images(0).OCR miLANG_CHINESE_SIMPLIFIED, True, True '有用的就此一句,识别为中文简体

Set modiLayout = miDoc.Images(0).Layout '读出数据
strLayoutInfo = _
"Language: " & modiLayout.Language & vbCrLf & _
"Number of characters: " & modiLayout.NumChars & vbCrLf & _
"Number of fonts: " & modiLayout.NumFonts & vbCrLf & _
"Number of words: " & modiLayout.NumWords & vbCrLf & _
"Beginning of text: " & Left(modiLayout.Text, 50) & vbCrLf & _
"First word of text: " & modiLayout.Words(0).Text
MsgBox strLayoutInfo, vbInformation + vbOKOnly, "Layout Information"
Set modiLayout = Nothing
Set miDoc = Nothing
Screen.MousePointer = vbDefault
End Sub

需要先安装CHSOCR.msi
luciferisnotsatan 2011-11-03
  • 打赏
  • 举报
回复
可能汉王不打算卖这技术吧
guyulf 2011-11-03
  • 打赏
  • 举报
回复
要求: 1. 文字库需比较完整, 因为关联到授权书,合同类的图片文字识别,还需要简体/繁体汉字。
2. 不是独占方式, 因为这个系统具备较大数据量的并发性(可实例化或者具备多线程调用)。
3. 识别率及处理速度。

24,854

社区成员

发帖
与我相关
我的任务
社区描述
C/C++ 工具平台和程序库
社区管理员
  • 工具平台和程序库社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧