lucene如何统计一个文件中出现次数最多的词语,统计各个分词的词频

catchers 2016-12-28 06:07:43
各位大神,如题,以前没接触过lucene,现在需要根据mmseg4j或者其他的分词结果,找到一个文件中出现次数最多的几个词语,最好附上代码说明,小弟感激不尽
...全文
361 1 打赏 收藏 转发到动态 举报
写回复
用AI写文章
1 条回复
切换为时间正序
请发表友善的回复…
发表回复
younglao 2016-12-28
  • 打赏
  • 举报
回复
创建索引时必须存储TermVector,然后使用reader.numDocs()获取所有的文档,TermFreqVector termFreq=reader.getTermFreqVector(docid,field)遍历文档,termFreq.getTerms()获取分词,termFreq.getTermFrequencies();获取词频

50,523

社区成员

发帖
与我相关
我的任务
社区描述
Java相关技术讨论
javaspring bootspring cloud 技术论坛(原bbs)
社区管理员
  • Java相关社区
  • 小虚竹
  • 谙忆
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧