lucene 站内搜索原理请教

yan0063 2009-02-19 01:12:15
在考虑lucene做站内搜索
现在能查到的有两种主要的方式 一种是用蜘蛛进行网站抓取 然后分析,但是动态网页对蜘蛛抓取效果不是特别的好。
另外一种是直接对数据库进行索引建立 然后进行搜索。
现在我不明白 在web搜索中 通过lucene建立的索引能找到对应的页面么?
总感觉第二种方式实现的站内搜索是一种孤立的,不能搜索到具体页面的搜索方式。
但是如果是这样的话这种搜索又失去了其具体的意义。
我这些想法哪里不对请大家指出,谢谢!
...全文
133 1 打赏 收藏 转发到动态 举报
写回复
用AI写文章
1 条回复
切换为时间正序
请发表友善的回复…
发表回复
wxwyes 2009-02-19
  • 打赏
  • 举报
回复
建立索引时要保存足够的信息。
如文章的ID你总要保存在索引中吧,搜索时你就可以得到符合条件的文章ID,然后再根据这个ID显示这篇文章。。。

67,513

社区成员

发帖
与我相关
我的任务
社区描述
J2EE只是Java企业应用。我们需要一个跨J2SE/WEB/EJB的微容器,保护我们的业务核心组件(中间件),以延续它的生命力,而不是依赖J2SE/J2EE版本。
社区管理员
  • Java EE
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧