lucene做成像百度那样的搜索引擎该如何下手???

xiaoxiao8372 2007-08-02 01:19:12
当然不要求功能什么的,只要能检索出网页和排序就行了。
我的想法是把网页捉下来,在将html转成文档。可这样就达不到预想的效果了,高人们指点一下吧。
...全文
221 4 打赏 收藏 转发到动态 举报
写回复
用AI写文章
4 条回复
切换为时间正序
请发表友善的回复…
发表回复
IhaveGotYou 2007-08-17
  • 打赏
  • 举报
回复
1:后台程序源源不断提取html源代码并存储数据库
2:建立web服务端,响应客户端请求(收到请求后再到数据库进行词法解析,正则查找并反馈)
nvgui8 2007-08-15
  • 打赏
  • 举报
回复
如果你对数据库进行全文检索,而且你对Lucene建立的索引的更新非常的不乐意,那我建议你用Compass来替换Lucene
myydzhz 2007-08-14
  • 打赏
  • 举报
回复
weblucene可以拿来用
keniv 2007-08-12
  • 打赏
  • 举报
回复
自己写个网络爬虫前端,然后用它抓取网页,用lucene建立索引,建立分词库,然后写个用户界面就行了。最好你的爬虫的功能很强大,你的服务器也够强大才行

62,623

社区成员

发帖
与我相关
我的任务
社区描述
Java 2 Standard Edition
社区管理员
  • Java SE
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧