社区
Java EE
帖子详情
lucene 站内搜索原理请教
yan0063
2009-02-19 01:12:15
在考虑lucene做站内搜索
现在能查到的有两种主要的方式 一种是用蜘蛛进行网站抓取 然后分析,但是动态网页对蜘蛛抓取效果不是特别的好。
另外一种是直接对数据库进行索引建立 然后进行搜索。
现在我不明白 在web搜索中 通过lucene建立的索引能找到对应的页面么?
总感觉第二种方式实现的站内搜索是一种孤立的,不能搜索到具体页面的搜索方式。
但是如果是这样的话这种搜索又失去了其具体的意义。
我这些想法哪里不对请大家指出,谢谢!
...全文
133
1
打赏
收藏
lucene 站内搜索原理请教
在考虑lucene做站内搜索 现在能查到的有两种主要的方式 一种是用蜘蛛进行网站抓取 然后分析,但是动态网页对蜘蛛抓取效果不是特别的好。 另外一种是直接对数据库进行索引建立 然后进行搜索。 现在我不明白 在web搜索中 通过lucene建立的索引能找到对应的页面么? 总感觉第二种方式实现的站内搜索是一种孤立的,不能搜索到具体页面的搜索方式。 但是如果是这样的话这种搜索又失去了其具体的意义。 我这些想法哪里不对请大家指出,谢谢!
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
1 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
wxwyes
2009-02-19
打赏
举报
回复
建立索引时要保存足够的信息。
如文章的ID你总要保存在索引中吧,搜索时你就可以得到符合条件的文章ID,然后再根据这个ID显示这篇文章。。。
Lucene
实战讲解课程
Lucene
是apache软件基金会4 jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,但它不是一个完整的...人们经常提到信息检索程序库,虽然与搜索引擎有关,但不应该将信息检索程序库与搜索引擎相混淆
Lucene
近实时搜索应用总结
最近因工作需要,用到了
Lucene
,在需求中,需要对生成的索引文件不断的更新、新增、删除等操作,同时还要实时的看到索引改动后的数据,在使用过程中碰到了
Lucene
里几个比较常见的问题,特来总结记录下。 我使用的是...
指导武汉章磊从0开始写类似
LUCENE
的全新搜索引擎
想
请教
下,你做这个搜索引擎,有这方面的基础不? 章小樣 18:40:36 例如创建索引的算法,检索的算法 章小樣 18:40:37 等等 横瓜 18:41:29 非常懂计算机 完全靠自己想出来的 章小樣 18:41:49 哦 章小樣 ...
lucene
如果我在企业内部网内实施web服务的话,采用UDDI的注册机制来实现web服务的发布、发现是不是复杂了些?因为企业内部不用牵涉到那么多的公司,我们也没有必要将服务描述得那样详细.是不是可以采用自己的...
LUCENE
检索速度优化方案-与我很平凡交流经验(2)
只要正文里面出现的,没有搜索不到的 横瓜 19:26:42 优化搜索是可以达到百度的效果 但是需要硬件配合 丶__我很平凡 19:27:00 你是专门搞这个的吗? 横瓜 19:27:09 目前没有那个精力去搞了 横瓜 1...
Java EE
67,513
社区成员
225,879
社区内容
发帖
与我相关
我的任务
Java EE
J2EE只是Java企业应用。我们需要一个跨J2SE/WEB/EJB的微容器,保护我们的业务核心组件(中间件),以延续它的生命力,而不是依赖J2SE/J2EE版本。
复制链接
扫一扫
分享
社区描述
J2EE只是Java企业应用。我们需要一个跨J2SE/WEB/EJB的微容器,保护我们的业务核心组件(中间件),以延续它的生命力,而不是依赖J2SE/J2EE版本。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章