要做一个网站,功能要求能在站内全文检索,如同百度www.baidu.com一样的功能,不是简单检索

123for 2005-06-22 11:38:47
我们有一个项目,要求做这样一个网站,网站内容的page很多。
要求有一个检索功能,注意:这里的检索不是那些根据什么条件(比如文章发布日期啦,发布作者啦,什么的)而是随便输入一个或者两个或几个关键词,就要象www.baidu.com一样的检索功能,只不过是检索的是本站内的全部相关page.比如,输入"张三 asp "这两个关键词,就能检索出本站内所有的同时含有"张三" and "asp"这两个关键词的page,而且显示的时候也要按www.baidu.com那样显示,显示出一段文字,进入超链接后才进入具体的该页面。

请问技术上能否实现?如何实现?asp + sqlserver? jsp +sqlserver?
...全文
244 15 打赏 收藏 转发到动态 举报
写回复
用AI写文章
15 条回复
切换为时间正序
请发表友善的回复…
发表回复
位流 2005-06-23
  • 打赏
  • 举报
回复
可以实现,你把所有页面入到数据库里就行了。
sfwxw0456 2005-06-23
  • 打赏
  • 举报
回复
说的对,如果要做的话要把这些全部写到数据库了里!
是不是可以这样啊,把可能要搜索的页面用ASP组件生成HTML文件,这样的话文字内容都写到数据库,而且显示的时候也是静态页面,不影响速度。
龙华 2005-06-23
  • 打赏
  • 举报
回复
如果要在本站内实现检索,可以调用Google或者Baidu的功能。

如果要在和自己站点类似的某些同类网站实现检索,还是要靠一个简单的爬虫机器人。
怎么最近这么多人找这个东西。如楼上所说,要是那么好做,Google该关门了。
underone 2005-06-23
  • 打赏
  • 举报
回复
接分
lnboy1003 2005-06-23
  • 打赏
  • 举报
回复
wgf001 2005-06-23
  • 打赏
  • 举报
回复
完全象baidu是不可能的,不然他们就要关门了
不过功能比他差点,速度比他慢点还是可以实现的
这就要看楼主对数据库的了解和对ASP的熟练程度了
raas 2005-06-23
  • 打赏
  • 举报
回复
楼上几位说话都很有深度啊!
haoder 2005-06-23
  • 打赏
  • 举报
回复
实现全文检索有很多关键技术.如果数据量达不到海量的话,可以直接到数据库中检索.
如果数据量很大,又对速度要求比较高,那么就需要建立索引了.建立索引的前提就是要将你所有的文章里面的关键词提取.也就是分词技术.
然后对每个关键词建立索引文件.也就是,哪些文章包括了这个关键词,它的词频是多少,都要预先做好.
个人见解.
hucool 2005-06-23
  • 打赏
  • 举报
回复
楼上有的说的有深度!
白夜花寒 2005-06-23
  • 打赏
  • 举报
回复
无论什么数据库都不能做到像BAIDU这么快的,你要做的工作最多也就是csdn这样的

列举关键词,当然这个工作很巨大,可以从网上搜索数据库,匹配+存入,还有可以做一个自己的网络

机器人,网络机器人的算法很好找,但是做得非常好不容易,大家不要动不动就说baidu google,如果

你都能做到了,他们还怎么吃饭呢?我们做的跟他们的技术从本质上不一样的,单纯用asp和jsp都不能

达到很好的效果的
zwrtv 2005-06-23
  • 打赏
  • 举报
回复
UP
kevin_gao 2005-06-23
  • 打赏
  • 举报
回复
http://www.codeproject.com/asp/indexserver.asp
patchclass 2005-06-23
  • 打赏
  • 举报
回复
关键是 分词 的算法啊
kevin_gao 2005-06-23
  • 打赏
  • 举报
回复
呵呵,确实,不要动不动就google和baidu ,人家成为千万富翁就那么容易么?

还是简单点用一些现成的东西实现一下简单的功能把!

可以考虑用win2k上的indexServer组件,请参考如下文章
http://www.ahcit.com/200305/32.doc

或者你搜索一下"ixsso.Query"关键字.

在 www.codeproject.com上也有现成的例程!
123for 2005-06-23
  • 打赏
  • 举报
回复
如果把网页内容都存到数据库,那如果网页有很多,比如可能有1000万页(最多的一种可能是1000万pages),
那数据库要很大吧?然后再来检索,速度可能很慢吧?关键词是用户随意的,不可能先预置关键词。一篇文章的任何一个词都有可能是查询的关键词.

28,406

社区成员

发帖
与我相关
我的任务
社区描述
ASP即Active Server Pages,是Microsoft公司开发的服务器端脚本环境。
社区管理员
  • ASP
  • 无·法
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧