社区
王而川的课程社区_NO_3
深度学习--LSTM模型写诗实战视频精讲
帖子详情
NGram模型
王而川
2023-01-12 23:40:18
课时名称
课时知识点
NGram模型
...全文
191
回复
打赏
收藏
NGram模型
课时名称课时知识点NGram模型
复制链接
扫一扫
分享
转发到动态
举报
AI
作业
写回复
配置赞助广告
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
(源码)基于
Ng
ram
模型
的中文文本纠错系统.zip
# 基于
Ng
ram
模型
的中文文本纠错系统 ## 项目简介 该项目通过
Ng
ram
模型
与Perplexity(PPL)指标实现中文文本的简单纠错。主要利用
Ng
ram
语言
模型
预测文本中字符替换后的概率提升,从而进行文本纠错。项目适用于学习
Ng
ram
模型
的计算和PPL评价指标的应用。 ## 项目的主要特性和功能 1.
Ng
ram
模型
实现通过训练语料库建立
Ng
ram
语言
模型
,用于预测文本中字符替换后的概率。 2. PPL指标应用利用Perplexity指标评估替换字符后句子的概率提升,决定是否进行纠错。 3. 同音字替换引入同音字字典,辅助纠正常见的同音错别字。 4. 阈值控制设定阈值,只有当替换字符后句子的概率提升超过阈值时,才进行替换,控制纠错精度。 ## 安装使用步骤 1. 复制项目代码 bash 2. 运行代码 bash python .correct.py ## 文件结构介绍
ng
ram
模型
分词与统计算法.zip_
NG
ram
算法_
ng
ram
分词_
ng
ram
模型
分词与统计算法_n元
模型
_按n-g
ram
N-G
ram
(有时也称为N元
模型
)是自然语言处理中一个非常重要的概念,通常在NLP中,人们基于一定的语料库,可以利用N-G
ram
来预计或者评估一个句子是否合理。另外一方面,N-G
ram
的另外一个作用是用来评估两个字符串之间的差异程度。这是模糊匹配中常用的一种手段。本文将从此开始,进而向读者展示N-G
ram
在自然语言处理中的各种powerful的应用。
NG
ram
:
NG
ram
模型
平滑新词
NG
ram
NG
ram
Model smooth new word 该项目实现了
NG
ram
模型
,但主要实现2元和3元语法
模型
,主要涉及的技术包括
NG
ram
生成、起始字符统计、平滑技术,此外还包括一些应用,比如新词发现。 目前该项目还有待完善。
基于MP最大概率的
Ng
ram
汉语切分(北邮计算机语言学基础)
基于MP最大概率的
Ng
ram
汉语切分(北邮计算机语言学基础) 有简洁的说明文档和python源代码
ng
ram
-la
ng
uage-model:HMM
Ng
ram
语言
模型
的实现
ng
ram
-语言
模型
一个 HMM
Ng
ram
语言
模型
在 Python 中的实现。 目前实现了基本的
NG
ram
分析,并提供了一个接口来从你最喜欢的语料库中创建采样器。 使用 run_sampli
ng
_from_corpus.py 在文本文件中的语料库上创建训练样本。 有关输入参数的更多信息,请键入 run_sampli
ng
_from_corpus.py -h 为了获得更多控制,您可以从实用程序模块导入 SentenceSamplerUtility 类,该类为采样器构造机制提供了方便的包装器。 来自古腾堡计划(包含在测试目录中)的 Edgar Allan Poe 作品集训练的三元
模型
的一些亮点: "And yet all was blackness and vacancy." "Notwithstandi
ng
the obscurity which thus oppres
王而川的课程社区_NO_3
1
社区成员
84
社区内容
发帖
与我相关
我的任务
王而川的课程社区_NO_3
AI培训讲师,f-college创始人,天津大学无人驾驶团队成员,原乐川科技技术部经理。
复制链接
扫一扫
分享
社区描述
AI培训讲师,f-college创始人,天津大学无人驾驶团队成员,原乐川科技技术部经理。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章