159
社区成员
发帖
与我相关
我的任务
分享
本次作业统一标题:NLP作业01:请利用HMM实现词性标注
Deadline:2023-04-19 20:30
这个作业属于那个课程 | 自然语言处理 |
---|---|
这个作业要求在哪里 | <写上作业的链接> |
我在这个课程的目标是 | <写上你的目标> |
这个作业在那个具体方面帮助我实现目标 | <写上具体方面> |
参考文献 | <写上作业所参考的文献资料> |
1.利用“1998人民日报词性标注语料库”进行模型的训练。
2.根据数据估计HMM的模型参数:全部的词性集合Q,全部的词集合V ,初始概率向量PI ,词性到词性的转移矩阵A ,词性到词的转移矩阵B 。 可以采用频率估计概率的方法计算模型参数,但需要进一步采用拉普拉斯平滑处理。
3.在模型预测阶段基于维特比算法进行解码,并给出测试文本:“那个球状闪电呈橘红色,拖着一条不太长的尾迹,在夜空中沿一条变换的曲线飘行着。”的词性标注结果。
(1)作业头:请务必加上作业头,认真填写作业头的内容,特别是目标和参考文献。(1分)
(2)对HMM模型进行介绍:必须是在自身理解的基础上进行总结,可以借鉴,但不可以抄袭。(2分)
(3)估计HMM的模型参数:对模型参数估计所采用的公式进行介绍,并给出相应实现代码(2分)
(4)基于维特比算法进行解码:对维特比算法进行介绍,并给出相应实现代码(3分)
(5)词性标注结果:给出题目要求的测试文本的词性标注结果,并对结果进行分析,针对标注结果不理想的情况,请给出具体解决方案。(2分)
提交作业可以获得红包。
红包过期了