错别字识别功能

hpf164111850 2012-04-16 10:55:05
目前做文章采集系统,需要对文章扫描,自动识别错别字,这个功能该如何实现呢?
大家有什么好的思路介绍下,我在百度上搜了下,没有合适的答案,一般就是用word,文本矫正!
但是通过程序如何去调用呢,没指定的api。
或者有没有比word更好的软件,能够通过程序访问实现的?
...全文
2578 51 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
51 条回复
切换为时间正序
请发表友善的回复…
发表回复
sunmeal 2012-04-27
  • 打赏
  • 举报
回复
可以和我联系
绿领巾童鞋 2012-04-24
  • 打赏
  • 举报
回复
要弄真好的话,就那不了得了。
1.语法库。
2.词组库。
3.语义库。

首先,你遍历从字到词到句,才能判定这个字出现是否合理;否则一个疯子乱说话,你都认为那是错字?
马肠河 2012-04-24
  • 打赏
  • 举报
回复
利用电子词典查,如果查不出来,就是错别字!
PCI_E 2012-04-24
  • 打赏
  • 举报
回复
推荐参考下google的搜索引擎学术论文,如果想找点思路,可以看看google黑板报上的一篇文章,吴军写的,叫什么“浪潮之巅”.
PCI_E 2012-04-24
  • 打赏
  • 举报
回复
分词系统就是程序写好以后,也是需要到一个特点领域去进行训练的。因为有些语义是在特定领域下才是有意思的。就跟训狗一样,你的用程序去训练你的分词库。
Delta 2012-04-23
  • 打赏
  • 举报
回复
要弄真好的话,就那不了得了。
startstartsvip 2012-04-23
  • 打赏
  • 举报
回复
要弄真好的话,就那不了得了。
勇敢的心515 2012-04-23
  • 打赏
  • 举报
回复
要真弄好的话,那就不得了了。
朕赐你肥皂 2012-04-23
  • 打赏
  • 举报
回复
狮识豕,豕识狮。始,狮嗜舐豕;豕适。豕时侍狮食柿,狮适。时逝,狮始试豕势。狮舐豕时,适时试噬豕。狮嗜豕时,豕试噬狮。狮嗜豕时,豕适示狮。豕噬狮时,狮奭。豕始识狮势实势。豕蓍筮,筮示:狮实誓噬弑豕。豕饰失势,事事适狮。时时侍狮。师事狮。试使狮释豕。是时,豕视虱噬狮,狮拭虱,狮实失适。豕舐狮时,噬虱示狮。豕时时噬虱示狮,使狮适。狮视豕噬虱,狮释。狮始识豕势实是噬虱,豕失势。狮始矢誓弑豕。适时,豕适噬虱示狮,狮示豕:豕噬虱失实,豕实是试弑狮。狮始施狮式示豕。豕视狮式,豕失屎。狮始噬弑豕。狮噬食豕势,豕失势,豕逝世。

我这个稍微打错一个字,你看怎么识别?
luozhuang 2012-04-23
  • 打赏
  • 举报
回复
国内有 黑马校对
这种软件 价格很贵的
API 应该不开放
zh520 2012-04-19
  • 打赏
  • 举报
回复
人工智能 可以解决
Aries_0219 2012-04-19
  • 打赏
  • 举报
回复
- = 能不能把文字再后台放入word,然后调用word的API去检验?
金河流域 2012-04-19
  • 打赏
  • 举报
回复
能写出这个功能,那就不得了了
yigemingzi1024 2012-04-18
  • 打赏
  • 举报
回复
[Quote=引用 4 楼 的回复:]
别想了,word 的提示基本都是错的。
[/Quote]

差不多,每次用Word都是把这个功能给关了。不过外国人对中文研究的可能不是太好,期待牛人!
wolf_410 2012-04-18
  • 打赏
  • 举报
回复
盘古分词。。你百度下就有,开放源码的。。。
思路跟你这个差不多
anzhiqiang_touzi 2012-04-18
  • 打赏
  • 举报
回复
给你整句四川话看你能识别不?

等哈哈来,我这忙,老火哦。
微信公众号 2012-04-18
  • 打赏
  • 举报
回复
搜狗的智能输入就挺好的,能提示错别字,你试一下,从拼音入手……
hpf164111850 2012-04-18
  • 打赏
  • 举报
回复
[Quote=引用 33 楼 的回复:]

盘古分词。。你百度下就有,开放源码的。。。
思路跟你这个差不多
[/Quote]

嗯,我去看看,多谢
hpf164111850 2012-04-18
  • 打赏
  • 举报
回复
[Quote=引用 32 楼 的回复:]

给你整句四川话看你能识别不?

等哈哈来,我这忙,老火哦。
[/Quote]

呵呵,
李亚超 2012-04-17
  • 打赏
  • 举报
回复
先分词,对于切分不确定的,用NGram语言模型处理。
加载更多回复(29)
【资源介绍】 基于TensorFlow+Bert弱监督训练的中文错别字识别python源码+项目说明+数据.zip 基于弱监督训练的中文错别字识别,只需加入正确的文本就行,例如人民日报、新华社这种置信度高的 运行方式 #python3+tensorflow1.14 ``` cd data && sh generate_data.sh && cd .. && sh run.sh ``` #如果有提示python包问题,自行pip install即可 数据 只需把正确文本按行放到./data/samples文件即可,程序会自动分句并生成错误文本 基于正确文本随机生成错别字,保证同音字、近音字、常见字、词组出现的频率更高,更接近真实的错误 模型 - 用了千万级别的数据,识别正式文章效果比较好。专有名词,新词易误报,加入相关的数据就能改善。 基于TensorFlow+Bert弱监督训练的中文错别字识别python源码+项目说明+数据.zip 基于TensorFlow+Bert弱监督训练的中文错别字识别python源码+项目说明+数据.zip 基于TensorFlow+Bert弱监督训练的中文错别字识别python源码+项目说明+数据.zip 【备注】 该项目是个人毕设/课设/大作业项目,代码都经过本地调试测试,功能ok才上传,高分作品,可快速上手运行!欢迎下载使用,可用于小白学习、进阶。 该资源主要针对计算机、通信、人工智能、自动化等相关专业的学生、老师或从业者下载使用,亦可作为期末课程设计、课程大作业、毕业设计等。 项目整体具有较高的学习借鉴价值!基础能力强的可以在此基础上修改调整,以实现不同的功能。 欢迎下载使用,也欢迎交流学习!

62,245

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术交流专区
javascript云原生 企业社区
社区管理员
  • ASP.NET
  • .Net开发者社区
  • R小R
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

.NET 社区是一个围绕开源 .NET 的开放、热情、创新、包容的技术社区。社区致力于为广大 .NET 爱好者提供一个良好的知识共享、协同互助的 .NET 技术交流环境。我们尊重不同意见,支持健康理性的辩论和互动,反对歧视和攻击。

希望和大家一起共同营造一个活跃、友好的社区氛围。

试试用AI创作助手写篇文章吧