◆◆◆◆◆◆◆请问金山词霸的词库开发者是如何输入如此海量的词汇的,难道是靠人的手动输入吗?◆◆◆◆◆◆◆

crossbow 2004-09-29 02:36:21
不知道海量文本是如何输入的,就像金山词霸的词库那样,几十万的词汇,成百万上千万的字符我想不可能是用键盘手动输入的吧?

目前小弟想把一本辞典录成普通文本文件,好像听说过什么尚书识别系统能够进行类似的工作,哪位兄台用过的请多多赐教,不知识别效果如何?谢谢!
...全文
124 15 打赏 收藏 转发到动态 举报
写回复
用AI写文章
15 条回复
切换为时间正序
请发表友善的回复…
发表回复
懒猫 2004-09-30
  • 打赏
  • 举报
回复
嗯,学习中……
crossbow 2004-09-29
  • 打赏
  • 举报
回复
ABBYY FineReader 7.0专业版是最新、最准确的ABBYY OCR软件版本。它可以为用户提供最高级别识字精确率,是一个非常节省时间的好方案。FineReader允许你将各种纸张和电子文件转换、编辑以及重新使用,包括:杂志、报纸、传真、复制和PDF文件。注意:这是一个非常大的文件(55MB),需要费些时间下载。
crossbow 2004-09-29
  • 打赏
  • 举报
回复
看了刘洋兄熟悉OCR了,能介绍一下OCR的工作原理吗?为什么不能大量处理?
crossbow 2004-09-29
  • 打赏
  • 举报
回复
呵呵,我是在别的论坛上请教Nicrosoft,不知道他老人家在不在线...

我本来是打算花几千块雇个打工妹来搞定,而且最后还要逐一审核。但突然看到这个,就想走走捷径:

http://www.russky.net/down/list.asp?id=296
xajacky 2004-09-29
  • 打赏
  • 举报
回复
呵呵,好像只有这样吧
ly_liuyang 2004-09-29
  • 打赏
  • 举报
回复
我估计最初的都是手动录入
但不是金山做的,金山买回来的
因为印刷都是电子排版的,当然有电子文档了,你给钱当然会卖给你了
OCR是不可能这么大量处理的:)

http://lysoft.7u7.net
nSCSI 2004-09-29
  • 打赏
  • 举报
回复
拿本牛津英汉字碘去扫描一下就完了
兵兵 2004-09-29
  • 打赏
  • 举报
回复
肯定是手工输入的!
hkbarton 2004-09-29
  • 打赏
  • 举报
回复
总有一个人是用手工输入的,这个不用怀疑吧,要不然哪来的?
懒猫 2004-09-29
  • 打赏
  • 举报
回复
嘿嘿,楼主这个问题有创意,就冲这个创意,我帮你up上去。
在这里问,不如发个Email或者打电话咨询金山也不错哦。
juliens 2004-09-29
  • 打赏
  • 举报
回复
我想,最终我想是手工输入的吧??

其他方法想不出来诶!
jackie168 2004-09-29
  • 打赏
  • 举报
回复
應該是~~。否則它從哪里來~~
而且我想應該不會把這么大的工作量分別一個人~~
cghdenglu 2004-09-29
  • 打赏
  • 举报
回复
gz
crossbow 2004-09-29
  • 打赏
  • 举报
回复
你的意思是Crack别人的?那第一个吃螃蟹的人不可能用的是手动输入吧?
shitianj 2004-09-29
  • 打赏
  • 举报
回复
是个难题~~
我想他们利用以前已有的数据吧

828

社区成员

发帖
与我相关
我的任务
社区描述
Delphi 非技术区
社区管理员
  • 非技术区社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧