请问:海量数据搜索

sfssmiss 2006-06-12 10:54:10
能帮一下这个问题吗?我是一个新手要做这一个谢谢各位帮助

1.就拿50分数据来说我要做的就等于说是网站搜索引擎,我要对自已的数据做一个搜索
应该怎么来写。怎么一个思路。
2.速度与准备度上一定要高。这一个要很好的代码。

这是我的两个要实现的目的。

真的在一次先谢谢!

应该有很多人对这方面感兴趣

请各位多提提看法与实例,实现的代码
...全文
427 11 打赏 收藏 转发到动态 举报
写回复
用AI写文章
11 条回复
切换为时间正序
请发表友善的回复…
发表回复
sfssmiss 2006-06-22
  • 打赏
  • 举报
回复
TO:mg1616(内网)


多谢 大家都来像这样提提自已的思路!~~


全文索引 这样的速度最终都是慢的呀~~~准备度对于一个专业的搜索来说是够用的

你的权重不太明白!希望能多多指点

mg1616 2006-06-14
  • 打赏
  • 举报
回复
说下我对二次索引的理解,先把搜集的网页去标签处理,就是删除<xxx></xxx>,然后用全文索引(或其他方式,比如 like %%)对每个关键字搜索一遍,对搜索结果根据“搜索算法”进行权重计算并保存,以后的搜索就按这个权重进行排序。

进行权重计算的“搜索算法”一般是自己开发的,比如含关键字次数在5次左右权重最高,过多或过少则减少权重,还有其他等等规则,据说 google 有一百多种权重计算规则,呵呵,慢慢加去吧
sfssmiss 2006-06-13
  • 打赏
  • 举报
回复
全文索引数据量大的情况下得不到

关键字的准确结果,速度 达不到这两方面呀!
Drate 2006-06-13
  • 打赏
  • 举报
回复
楼主的这个问题应该采用MS的全文索引就可以解决这个问题了吧。
sfssmiss 2006-06-13
  • 打赏
  • 举报
回复
是垂直搜索引擎

主要的现在要做一个搜索关键字时准确,分词也只有1--2万,有新的关键词就写入索引表中,就是这样做,,,在者就是要求速度要快,

就是怎么样建一个索引表,然后对数据库操作..........

各位多给些意见。。。谢谢!~~
sfssmiss 2006-06-12
  • 打赏
  • 举报
回复
各位也帮写写这个的实例。给我们学习学习一下:)
sfssmiss 2006-06-12
  • 打赏
  • 举报
回复
是啊我知道这个是一个有难度的问题就像一个工程一个项目一样!~~

不过我想代码不会过2000吧呵呵!~~
sfssmiss 2006-06-12
  • 打赏
  • 举报
回复
是后一种哦呵呵

蜘蛛爬页面 存储页面 现在这一块不用理会。就等于说有数据在数据库里了!~~接下来的就是分词 建立索引,2次索引 就是这个吧!~~

请指教:):)
gohst001 2006-06-12
  • 打赏
  • 举报
回复
要什么级别的? 如果只是要对数据库作搜索 使用全文索引吧 注意必须提供时间戳列。
如果要做成中文搜索引擎的样子那就麻烦大了,蜘蛛爬页面 存储页面 分词 建立索引,2次索引,建立索引服务器网格,前台程序扫描索引。。。 嗯 很麻烦就是了
gohst001 2006-06-12
  • 打赏
  • 举报
回复
偶也不是专业做这个的 :)
专业的搜索引擎 都是不用一般的商业数据库引擎的,然后要把索引存放到很多机器上,所以查询的速度才会那么快
分词 是个很大的问题应该是靠大量的经验数据解决的吧?猜测
skydate 2006-06-12
  • 打赏
  • 举报
回复
帮顶
我也想学习一下这些

期待

27,580

社区成员

发帖
与我相关
我的任务
社区描述
MS-SQL Server 应用实例
社区管理员
  • 应用实例社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧