数据库搜索引擎

cowleyking 2008-08-19 01:21:14
请问各位大牛,关于海量数据的查询除了数据库建索引之外,是否还关系到算法问题?
如果我想做一个数据库方面的搜索引擎该从何着手?
还有,百度搜索引擎它是怎么从数据库中快速检索到你所输入的关键字的?
希望得到各位高手的指导,谢谢!
...全文
836 6 打赏 收藏 转发到动态 举报
写回复
用AI写文章
6 条回复
切换为时间正序
请发表友善的回复…
发表回复
「已注销」 2009-01-21
  • 打赏
  • 举报
回复
顶起,正在学习
jimmyzzxhlh 2008-08-22
  • 打赏
  • 举报
回复
所谓倒排技术就是说,它把“文档里面有哪些词?”转化成了“哪些文档里面出现了某个词?”这样的问题
也就是说,对于文档里出现的某个词,索引的时候将哪些文档里面含有这个词给找出来,这样在搜索的时候就直接可以搜到了

关于数据库搜索,现在我使用compass来做,这个引擎还是不错的
既适合与Hibernate、Spring这种框架结合,也适合直接用Jdbc来建立与数据库的连接
具体的可以看这里
http://www.compass-project.org/
cowleyking 2008-08-21
  • 打赏
  • 举报
回复
楼上能否说的详细点?我是菜鸟,再次表示感谢!
gonxi 2008-08-21
  • 打赏
  • 举报
回复
这个就是关键词索引,也就是倒排表
cowleyking 2008-08-19
  • 打赏
  • 举报
回复
谢谢楼上的回答,怎样从海量数据中找出符合条件的数据呢?除了给数据库贱索引外还有什么办法?
是否会牵扯到算法问题?
gonxi 2008-08-19
  • 打赏
  • 举报
回复
搜索引擎一般不用数据库,因为性能太低,文件系统的效率要高,一般使用索引文件来处理

具体的就是分级索引。通过这个就可以找到关键词,然后通过查询倒排表,来找到相应的页面索引。

2,760

社区成员

发帖
与我相关
我的任务
社区描述
搜索引擎的服务器通过网络搜索软件或网络登录等方式,将Internet上大量网站的页面信息收集到本地,经过加工处理建立信息数据库和索引数据库。
社区管理员
  • 搜索引擎技术社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧