社区
Java SE
帖子详情
lucene做成像百度那样的搜索引擎该如何下手???
xiaoxiao8372
2007-08-02 01:19:12
当然不要求功能什么的,只要能检索出网页和排序就行了。
我的想法是把网页捉下来,在将html转成文档。可这样就达不到预想的效果了,高人们指点一下吧。
...全文
221
4
打赏
收藏
lucene做成像百度那样的搜索引擎该如何下手???
当然不要求功能什么的,只要能检索出网页和排序就行了。 我的想法是把网页捉下来,在将html转成文档。可这样就达不到预想的效果了,高人们指点一下吧。
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
4 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
IhaveGotYou
2007-08-17
打赏
举报
回复
1:后台程序源源不断提取html源代码并存储数据库
2:建立web服务端,响应客户端请求(收到请求后再到数据库进行词法解析,正则查找并反馈)
nvgui8
2007-08-15
打赏
举报
回复
如果你对数据库进行全文检索,而且你对Lucene建立的索引的更新非常的不乐意,那我建议你用Compass来替换Lucene
myydzhz
2007-08-14
打赏
举报
回复
weblucene可以拿来用
keniv
2007-08-12
打赏
举报
回复
自己写个网络爬虫前端,然后用它抓取网页,用lucene建立索引,建立分词库,然后写个用户界面就行了。最好你的爬虫的功能很强大,你的服务器也够强大才行
lucene
实现类似
百度
搜索
本文将深入探讨如何使用
Lucene
来构建一个类似
百度
的
搜索引擎
。 ### 一、
Lucene
基本概念 1. **索引(Index)**:
搜索引擎
的核心是索引,类似于书籍的目录。
Lucene
把文档内容转换成倒排索引,使得快速查找匹配的...
百度
贴吧签到网站源码Java-study:网上看见供学习参考
正如大家所知,它是一家
做
搜索引擎
起家的公司。 无独有偶,一位名叫Doug Cutting的美国工程师,也迷上了
搜索引擎
。他
做
了一个用于文本搜索的函数库(姑且理解为软件的功能组件),命名为
Lucene
。
Lucene
是用JAVA写成...
elasticsearch-analysis-pinyin-5.6.8.zip
Elasticsearch是一款强大的开源
搜索引擎
,基于
Lucene
库构建,提供了实时、分布式、高可扩展的全文检索服务。在中文处理方面,Elasticsearch通常需要配合特定的分析器来实现对中文字符的正确分词和索引。"elastic...
史上最好传智播客就业班.net培训教程60G 不下会后悔
搜索引擎
技术:
Lucene
.Net、多线程开发、爬虫技术、网页分析、正则表达式、Log4Net日志框架、Quartz.Net定时作业调度。 大型互联网开发技术:代码生成、网页静态化、基于JQuery的Web2.0页面开发、AJAX、SEO、网站...
使用
Lucene
.net技术,仿
百度
搜索
Lucene
.Net
Lucene
.net是
Lucene
的.net移植版本,是一个开源的全文检索引擎开发包,即它不是一个完整的全文检索引擎,而是...利用这套API你可以
做
很多有关搜索的事情,而且很方便.。开发人员可以基于
Lucene
.net实现全
Java SE
62,623
社区成员
307,257
社区内容
发帖
与我相关
我的任务
Java SE
Java 2 Standard Edition
复制链接
扫一扫
分享
社区描述
Java 2 Standard Edition
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章