Java 中 匹配大量tag标签... 求解决效率的方法

请叫我带角凹凸曼 2014-12-04 01:55:31
我现在的需求是:
1: 我有几万个tag标签(也就是关键字)在数据库中
2:我在发布新闻的时候,用内容去匹配数据库中几万个关键字,如果文章中有相应的关键字按照出现的频率从高到底排序出来。


如果单纯的用关键字去匹配内容,是不是效率很低。 如果有好的实现方式,麻烦各位大侠赐教. 谢谢


其实我的需求就是我上传帖子一样,输入的内容按照规则提取关键标签。而不是人工输入、
...全文
290 2 打赏 收藏 转发到动态 举报
写回复
用AI写文章
2 条回复
切换为时间正序
请发表友善的回复…
发表回复
attilax 2014-12-05
  • 打赏
  • 举报
回复
首先分词 ,, 第二部分,全文索引,
howsun_zh 2014-12-05
  • 打赏
  • 举报
回复
用分词系统来做试试,ikanalyzer 、庖丁解牛、mmseg4j这种中文分词组件每秒能处理百万级字符。 http://bbs.csdn.net/topics/390937768

67,513

社区成员

发帖
与我相关
我的任务
社区描述
J2EE只是Java企业应用。我们需要一个跨J2SE/WEB/EJB的微容器,保护我们的业务核心组件(中间件),以延续它的生命力,而不是依赖J2SE/J2EE版本。
社区管理员
  • Java EE
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧