倒排索引表的求交集的算法,急!

Be_nurturing 2016-08-22 07:52:15
本人想找到关于求倒排索引的快速的算法,举例
中 = {1,2,3,4,5,7,8,10}
华 = {3,4,5,8,10}
人 = {1,4,5,7,8}
民 = {5,7,8,}
共 = {1,3,4,5,7,8}
汉字对应的是在文件中的行数,比如“中”1,2,3,4,5,7,8,10行出现了,其他的依次类推,现在我想查询“中华人名共”这5关键词同时出现,肯定是对所有的记录数字求交集,本人只回用list.retain()方法,此方法,只能解决数据量较小的情况,如果数据量大了,速度很慢,没有体现出倒排表的特点,请问有什么好的算法,对于数据比较多的情况也可以快速的查处想要的结果。最好有示例代码之类的。
...全文
326 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

62,628

社区成员

发帖
与我相关
我的任务
社区描述
Java 2 Standard Edition
社区管理员
  • Java SE
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧