英文文章如何提取Tag?可以大概讲一下算法思想吗?

woshigefantong 2010-09-25 12:08:38
小弟现在需要做这个东西,其实就是一片大概100多个单词的文章,在文章发表的时候,我需要提取文章中出现频率较高的词和词组做为Tag。
很多博客都实现了这个功能,但是我不知道这个算法应该如何去实现。那位指导一下。谢谢啦。
我现在处理的只是英文文章,不需要处理中文,所以应该会简单一点。
...全文
32 点赞 收藏 4
写回复
4 条回复
切换为时间正序
当前发帖距今超过3年,不再开放新的回复
发表回复
blazingfire 2010-09-25
按空格提取单词,再统计
回复
zhaoxinwei0706 2010-09-25
没听过。。。帮LZ顶一下。。。。。
回复
coolbamboo2008 2010-09-25
试试用lucene计算词频吧
回复
安心逍遥 2010-09-25
暂时没有想法,帮顶啦...祝楼主好运
回复
相关推荐
发帖
Web 开发
创建于2007-09-28

8.0w+

社区成员

Java Web 开发
申请成为版主
帖子事件
创建了帖子
2010-09-25 12:08
社区公告
暂无公告