如何实现统计海量数据出现频率最高的词

luweipo 2012-09-14 06:59:35
比如,多条聊天记录,要统计出现频率最高的词,

用什么技术实现

如何实现

请指教
...全文
287 1 打赏 收藏 转发到动态 举报
写回复
用AI写文章
1 条回复
切换为时间正序
请发表友善的回复…
发表回复
LogicTeamLeader 2012-09-14
  • 打赏
  • 举报
回复
[Quote=引用楼主 的回复:]
比如,多条聊天记录,要统计出现频率最高的词,

用什么技术实现

如何实现

请指教
[/Quote]
真的是海量么?那就使用Solr或者Lucene,反正就是全文检索技术。
哦对了,你这个不用那么复杂,使用一个中文分词的工具包就可以了,推荐ICTCLAS或者paoding,看几个例子便知道了。
不用感谢组长,结贴吧。

81,092

社区成员

发帖
与我相关
我的任务
社区描述
Java Web 开发
社区管理员
  • Web 开发社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧