/*** 关于"站内搜索"的问题 ***/

teacherli 2004-05-13 08:39:43
我现在想做一个关于站内新闻的程序,现在的问题是这样,我把所有的新闻都生成了表态的文件,文件的组织方式是以新闻类型为目录的,我想做一个程序,就是用户可以以新闻标题和新闻内容为关键字进行检索,把检索出来的新闻列出来,可是问题来了,
1.怎么么实现这关于内容的检索?
2.检索出来后怎么以新闻标题列表形式怎么列出来?

把我的情况简单说明一下:
1. 数据库中保存有所有新闻的标题与内容及生成静态页的路径
2. 数据库中存放的的这些新闻我都生成了静态文件.
3. 我在所有的新闻页中有
<meta name=”keywords” content=”网站内容关键字”> 标识
4. 我不想使用检索的时候从数据库中提取,因为如果以内容的方式查找的话实在太慢了
5. 说句大话:我就想要门户网站的搜索技术
6. 我没有钱,不要让我去买google.com
7. 有技术的说技术,有想法的说想法,谈的人越多越好:)
...全文
60 19 打赏 收藏 转发到动态 举报
写回复
用AI写文章
19 条回复
切换为时间正序
请发表友善的回复…
发表回复
lvjack 2004-05-14
  • 打赏
  • 举报
回复
4. 我不想使用检索的时候从数据库中提取,因为如果以内容的方式查找的话实在太慢了

检索数据库会比检索文件系统慢,不会吧,那还要数据库作什么,不才认为从数据库检索比检索文件系统中的文件快

还是从数据库中检索,最好能做一个索引表定期更新
asssa117 2004-05-14
  • 打赏
  • 举报
回复
贴点源码吧!各位做过的大侠!什么样的解决方法都行……
asssa117 2004-05-14
  • 打赏
  • 举报
回复
所以我想要个完美的办法呀^^^^^^^^^^
lvjack(叶飞)兄,怎么做,怎么实现?
关于新闻的关键字可以从数据库提取,但是想从内容中查找呢?数据库中十万八万新闻不算多,如果要从这堆东西中找出相关的东西,那要多长时间?
reners 2004-05-14
  • 打赏
  • 举报
回复
我也很想知道这方面的知识,请各位大虾多多指点...
hahawen 2004-05-13
  • 打赏
  • 举报
回复
哦,学习,

-------------
按唠叨的说法看,下面的方法好像可以达到同样的目的吧,我就是这么用的,但是不进行全文检索,查到的东西好像是很少啊:

在数据库存文章的表中加一个字段,用来保存关键字,这样关键字通过数据库就可以查找了,到是方便,
xuzuning 2004-05-13
  • 打赏
  • 举报
回复
通常一个网站有很多栏目,栏目还有子栏目
访问时一般的是通过导航菜单逐次进入
而网站地图一平面样式把所有栏目一并展现给你,也是一种导航方式
ccterran 2004-05-13
  • 打赏
  • 举报
回复
那么请教一下(唠叨) 老大,这种网站地图该如何建呢?
-------------------------------------------
他不是说了吗?“保存有主分类页面连接”,就像一般的网站上的网站地图或者网站导航一样,把主要的栏目,频道都列出来。。
ccterran 2004-05-13
  • 打赏
  • 举报
回复
首页-->子页1-->子页11-->子页111 ...
-->子页112 ...
-->子页113 ...
子页12 ...

子页2-->子页21 ...
-->子页22 ...
-->子页33 ...

但好像楼主要的并不是这样。。。
zzhhll003 2004-05-13
  • 打赏
  • 举报
回复
那么请教一下(唠叨) 老大,这种网站地图该如何建呢?
zzhhll003 2004-05-13
  • 打赏
  • 举报
回复
呵呵,我也挺想知道。
xuzuning 2004-05-13
  • 打赏
  • 举报
回复
这个问题是这样实现的:
1、构造一个基本页,其中保存有主分类页面连接。可利用网站的“网站地图”页
2、搜索时,读取该页分析出其中的连接并打开分析,如此循环
3、对每个后续页面均检查<meta name=”keywords” content=”网站内容关键字”>
标记是否含有待查找关键字,如有则暂存备后续处理

google就是这么做的,只是他使用专门的软件,昼夜不停的扫描intrnet。并把结果分门别类的保存在他的硬盘组里。当你使用google时,他是从硬盘组中检索,而非直接在intrnet上查找
ccterran 2004-05-13
  • 打赏
  • 举报
回复
利用google的站内搜索,只能搜索google已经收集到的该站的内容,而这只是一小部分,并不是真正的全站搜索
hahawen 2004-05-13
  • 打赏
  • 举报
回复
说个其他的方法(应该可以,我以前作过的,当时是免费用的,现在不知道了):

利用google的“站内搜索”功能,可以到网上找一下相关的资料,挺简单的。
efanlx 2004-05-13
  • 打赏
  • 举报
回复
不搜索数据库,而要实现搜索全部新闻,我也想知
ccterran 2004-05-13
  • 打赏
  • 举报
回复
不搜索数据库,而要实现搜索全部新闻,那就要遍历全部目录和文件,然后读取文件内容,和搜索关键字进行匹配。我想这你应该已经想到了。

也可以根据meta里的keywords,定期做一个索引,让访问者搜索的是这些关键字,这样就快一些。但估计准确度不高。
gowuliao 2004-05-13
  • 打赏
  • 举报
回复
我的想法是:我也想知道.呵呵.
asssa117 2004-05-13
  • 打赏
  • 举报
回复
首页-->子页1-->子页11-->子页111 ...
-->子页112 ...
-->子页113 ...
子页12 ...

子页2-->子页21 ...
-->子页22 ...
-->子页33 ...
=================================
得到这样的页面后我怎么才能把其中的相关新闻取出来呢?
我想利用<meta name=”keywords” content=”网站内容关键字”>,怎么做?
zzhhll003 2004-05-13
  • 打赏
  • 举报
回复
那网站地图是不是这样做的:
先在页面中做一个文本代码搜索把所有的超链接语句都搜到,然后存放在某一位子(比如数拒库的某个表中),最后把它在某一个页面中都列出来,是这样吗?不知道我理解得对不对?
cloudchen 2004-05-13
  • 打赏
  • 举报
回复
nt平台上ms有自带的indexing服务,可以实现文件系统的全文检索。
数据库系统的全文检索一般数据库软件都提供。
不知道linux平台上有没有相应的文件系统的全文检索?

21,886

社区成员

发帖
与我相关
我的任务
社区描述
从PHP安装配置,PHP入门,PHP基础到PHP应用
社区管理员
  • 基础编程社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧