社区
非技术区
帖子详情
假若爱又天意
wenbin
2008-05-31 08:59:52
classicriver
飘渺~~~陶醉
散分
...全文
141
14
打赏
收藏
假若爱又天意
classicriver 飘渺~~~陶醉 散分
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
14 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
hongcha99
2008-06-02
打赏
举报
回复
jf
路人乙e
2008-06-02
打赏
举报
回复
[Quote=引用 11 楼 rockyvan 的回复:]
标题什么意思?
[/Quote]
I dont know
貓哥是個傳說
2008-06-02
打赏
举报
回复
很飄渺。。
接分。。。
rockyvan
2008-06-02
打赏
举报
回复
标题什么意思?
zcl26
2008-06-02
打赏
举报
回复
再顶
zcl26
2008-06-02
打赏
举报
回复
jf
周公
2008-06-02
打赏
举报
回复
飘过...............................
yuanlai123
2008-06-02
打赏
举报
回复
前七,接分
闲游四疯
2008-06-02
打赏
举报
回复
前六 JF
hyblusea
2008-05-31
打赏
举报
回复
UP~~~~~~~+ 接分
一品梅
2008-05-31
打赏
举报
回复
[Quote=引用 2 楼 amandag 的回复:]
up
[/Quote]
一品梅
2008-05-31
打赏
举报
回复
[Quote=引用 2 楼 amandag 的回复:]
up
[/Quote]
amandag
2008-05-31
打赏
举报
回复
up
wenbin
2008-05-31
打赏
举报
回复
SF自己坐,嘿嘿
假如
爱
有
天意
.doc
假如
爱
有
天意
.doc
基于 Python 的错别字识别系统,可作为课程设计、毕业设计.zip
基于 Python 的错别字识别系统,可作为课程设计、毕业设计。 实现的功能如下:中文文本纠错划分 中文文本纠错任务,常见错误类型包括: 1 谐音字词,如 配副眼睛-配副眼镜 2 混淆音字词,如 流浪织女-牛郎织女 3 字词顺序颠倒,如 伍迪艾伦-艾伦伍迪 4 字词补全,如
爱
有
天意
-假如
爱
有
天意
5 形似字错误,如 高梁-高粱 6 中文拼音全拼,如 xingfu-幸福 7 中文拼音缩写,如 sz-深圳 8 语法错误,如想象难以-难以想象 当然,针对不同业务场景,这些问题并不一定全部存在,比如输入法中需要处理前四种,搜索引擎需要处理所有类型,语音识别后文本纠错只需要处理前两种, 其中’形似字错误’主要针对五笔或者笔画手写输入等。 简单总结了一下中文别字错误类型: 1 别字: 感帽,随然,传然,呕土 2 人名,地名错误:哈蜜(正:哈密) 3 拼音错误:咳数(ke shu)—> ke sou, 4 知识性错误:广州黄浦(埔) 5 用户发音、方言纠错:我系东北滴黑社会,俚蛾几现在在我手上。(我是东北的黑社会,你儿子现在在我手上。) 6 重复性错误:在 上 上面 上面 那
pycorrector:pycorrector is a toolkit for text error correction. 文本纠错,Kenlm,Seq2Seq_Attention,BERT,MacBERT,ELECTRA,ERNIE,Transformer等模型实现,开箱即用
| 简体中文 pycorrector 中文文本纠错工具。音似、形似错字(或变体字)纠正,可用于中文拼音、笔画输入法的错误纠正。python3.6开发。 pycorrector依据语言模型检测错别字位置,通过拼音音似特征、笔画五笔编辑距离特征及语言模型困惑度特征纠正错别字。 Guide Question 中文文本纠错任务,常见错误类型包括: 谐音字词,如 配副眼睛-配副眼镜 混淆音字词,如 流浪织女-牛郎织女 字词顺序颠倒,如 伍迪艾伦-艾伦伍迪 字词补全,如
爱
有
天意
-假如
爱
有
天意
形似字错误,如 高梁-高粱 中文拼音全拼,如 xingfu-幸福 中文拼音缩写,如 sz-深圳 语法错误,如 想象难以-难以想象 当然,针对不同业务场景,这些问题并不一定全部存在,比如输入法中需要处理前四种,搜索引擎需要处理所有类型,语音识别后文本纠错只需要处理前两种, 其中'形似字错误'主要针对五笔或者笔画手
YoungCorrector:基于规则的文本纠错系统
YoungCorrector 本项目是参考开源框架 ,自己实现了一套基于规则的纠错系统。总体来说,基于规则的文本纠错,性能取决于纠错词典和分词质量。目前与相比,在准确率差不多的情况下,本模型所用的时间会少很多(归功于前向最大匹配替代了直接索引替换字典)。代码还没有完善,还有很多优化的空间,后续会持续更新。。。 中文文本纠错 介绍 文本纠错的核心步骤:错误检测,预期召回,纠错排序。 错误检测:找到某些词是错误的。 初步召回:选出纠错错误词。 纠错排序:对预期词进行排序。 主流的三种方法: 基于规则:pycorrector 基于深度模型:百度纠错系统 基于垂直领域:腾讯DCQC纠错框架 中文纠错需要解决的问题: 谐音字词,如配副眼睛-配副眼镜 擅长音字词,如流浪织女-牛郎织女 字词顺序颠倒倒,如伍迪艾伦-艾伦伍迪 字词补全,如
爱
有
天意
-假如
爱
有
天意
形似字错误,如高梁-高粱 中文拼音全拼,如x
深圳面试java常见笔试题-pycorrector:错别字纠正算法。调用pycorrector接口,使用规则
深圳面试java常见笔试题 pycorrector 中文文本纠错工具。音似、形似错字(或变体字)纠正,可用于中文拼音、笔画输入法的错误纠正。python3开发。 pycorrector依据语言模型检测错别字位置,通过拼音音似特征、笔画五笔编辑距离特征及语言模型困惑度特征纠正错别字。 问题 中文文本纠错任务,常见错误类型包括: 谐音字词,如 配副眼睛-配副眼镜 混淆音字词,如 流浪织女-牛郎织女 字词顺序颠倒,如 伍迪艾伦-艾伦伍迪 字词补全,如
爱
有
天意
-假如
爱
有
天意
形似字错误,如 高梁-高粱 中文拼音全拼,如 xingfu-幸福 中文拼音缩写,如 sz-深圳 语法错误,如 想象难以-难以想象 当然,针对不同业务场景,这些问题并不一定全部存在,比如输入法中需要处理前四种,搜索引擎需要处理所有类型,语音识别后文本纠错只需要处理前两种, 其中'形似字错误'主要针对五笔或者笔画手写输入等。 解决方案 规则的解决思路 中文纠错分为两步走,第一步是错误检测,第二步是错误纠正; 错误检测部分先通过结巴中文分词器切词,由于句子中含有错别字,所以切词结果往往会有切分错误的情况,这样从字粒度和词粒度两
非技术区
7,763
社区成员
63,203
社区内容
发帖
与我相关
我的任务
非技术区
.NET技术 非技术区
复制链接
扫一扫
分享
社区描述
.NET技术 非技术区
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章