lucene的问题,高手进

fool_leave 2006-05-09 06:56:08
说实话,真是不报太大希望的一问,好像研究lucene的人很少


想实现这样的功能
从几个网站里搜索,建立索引的时候需要记录这个网页来自哪个网站.
搜索时,比如搜索"技术",要求能够把搜索到的网站和此网站包含多少个含有“技术”关键字的网页显示出来.
如:
搜索“技术”后显示
www.csdn.net 包含100条
www.sun.com 包含200条
......


我用lucene搜索的时候得到hits,然后遍历一边,记录每一条的网站名,可是由于要全部遍历,太费时间了。以前搜索出5000条也不过300毫秒,现在一下子就翻了10倍。


高手给点意见吧。
...全文
182 4 打赏 收藏 转发到动态 举报
写回复
用AI写文章
4 条回复
切换为时间正序
请发表友善的回复…
发表回复
treeroot 2006-05-26
  • 打赏
  • 举报
回复
简单的办法就是每个网站建一个索引,就隔开了
fool_leave 2006-05-26
  • 打赏
  • 举报
回复
用户第一次查询某个关键字的话没办法做cach
whyxx 2006-05-25
  • 打赏
  • 举报
回复
可以考虑做cache,以内存换时间
iwlk 2006-05-25
  • 打赏
  • 举报
回复
我也遇到类似的问题了.

62,616

社区成员

发帖
与我相关
我的任务
社区描述
Java 2 Standard Edition
社区管理员
  • Java SE
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧