关于分词技术

xiaoyunyun23 2013-01-10 12:04:05
老师给我一个毕业设计题目,是关于分词和主题词智能抽取技术及时变语料库自动生成的,求好心人发我点分词算法的学习资料,网上的论文我看不太懂,邮箱806064621@qq.com,谢谢了
...全文
110 2 打赏 收藏 转发到动态 举报
写回复
用AI写文章
2 条回复
切换为时间正序
请发表友善的回复…
发表回复
liuwons 2013-01-10
  • 打赏
  • 举报
回复
这是语义分析么?要是没要求分词正确率,可以直接用二二分词,要是要求正确率,可以用字典查找的方法,字典可以用庖丁解牛,查找用Lucence
sgyyz 2013-01-10
  • 打赏
  • 举报
回复
这个可以参考中科院的ICTCLAS,他具有较好的分词能力。http://www.oschina.net/p/freeictclas/ 但是如果是一句话,我建议你还是用ICTCLAS 如果是一篇文章,内容较多的,建议你通过词频统计,及使用贝叶斯方式来处理。 本人曾今做过一个文章相似以及个性化推荐的毕业设计,所用的技术就这两个,效果还是不错就是,基本能满足要求。 其实hibernate-search之类的工具对于中文来说,确实具有局限性。 希望对你有所帮助。

58,454

社区成员

发帖
与我相关
我的任务
社区描述
Java Eclipse
社区管理员
  • Eclipse
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧