倒排索引表的求交集的算法,急!
本人想找到关于求倒排索引的快速的算法,举例
中 = {1,2,3,4,5,7,8,10}
华 = {3,4,5,8,10}
人 = {1,4,5,7,8}
民 = {5,7,8,}
共 = {1,3,4,5,7,8}
汉字对应的是在文件中的行数,比如“中”1,2,3,4,5,7,8,10行出现了,其他的依次类推,现在我想查询“中华人名共”这5关键词同时出现,肯定是对所有的记录数字求交集,本人只回用list.retain()方法,此方法,只能解决数据量较小的情况,如果数据量大了,速度很慢,没有体现出倒排表的特点,请问有什么好的算法,对于数据比较多的情况也可以快速的查处想要的结果。最好有示例代码之类的。