/*** 关于"站内搜索"的问题 ***/

teacherli 2004-05-13 08:39:43
我现在想做一个关于站内新闻的程序,现在的问题是这样,我把所有的新闻都生成了表态的文件,文件的组织方式是以新闻类型为目录的,我想做一个程序,就是用户可以以新闻标题和新闻内容为关键字进行检索,把检索出来的新闻列出来,可是问题来了,
1.怎么么实现这关于内容的检索?
2.检索出来后怎么以新闻标题列表形式怎么列出来?

把我的情况简单说明一下:
1. 数据库中保存有所有新闻的标题与内容及生成静态页的路径
2. 数据库中存放的的这些新闻我都生成了静态文件.
3. 我在所有的新闻页中有
<meta name=”keywords” content=”网站内容关键字”> 标识
4. 我不想使用检索的时候从数据库中提取,因为如果以内容的方式查找的话实在太慢了
5. 说句大话:我就想要门户网站的搜索技术
6. 我没有钱,不要让我去买google.com
7. 有技术的说技术,有想法的说想法,谈的人越多越好:)
...全文
109 19 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
19 条回复
切换为时间正序
请发表友善的回复…
发表回复
lvjack 2004-05-14
  • 打赏
  • 举报
回复
4. 我不想使用检索的时候从数据库中提取,因为如果以内容的方式查找的话实在太慢了

检索数据库会比检索文件系统慢,不会吧,那还要数据库作什么,不才认为从数据库检索比检索文件系统中的文件快

还是从数据库中检索,最好能做一个索引表定期更新
asssa117 2004-05-14
  • 打赏
  • 举报
回复
贴点源码吧!各位做过的大侠!什么样的解决方法都行……
asssa117 2004-05-14
  • 打赏
  • 举报
回复
所以我想要个完美的办法呀^^^^^^^^^^
lvjack(叶飞)兄,怎么做,怎么实现?
关于新闻的关键字可以从数据库提取,但是想从内容中查找呢?数据库中十万八万新闻不算多,如果要从这堆东西中找出相关的东西,那要多长时间?
reners 2004-05-14
  • 打赏
  • 举报
回复
我也很想知道这方面的知识,请各位大虾多多指点...
hahawen 2004-05-13
  • 打赏
  • 举报
回复
哦,学习,

-------------
按唠叨的说法看,下面的方法好像可以达到同样的目的吧,我就是这么用的,但是不进行全文检索,查到的东西好像是很少啊:

在数据库存文章的表中加一个字段,用来保存关键字,这样关键字通过数据库就可以查找了,到是方便,
xuzuning 2004-05-13
  • 打赏
  • 举报
回复
通常一个网站有很多栏目,栏目还有子栏目
访问时一般的是通过导航菜单逐次进入
而网站地图一平面样式把所有栏目一并展现给你,也是一种导航方式
ccterran 2004-05-13
  • 打赏
  • 举报
回复
那么请教一下(唠叨) 老大,这种网站地图该如何建呢?
-------------------------------------------
他不是说了吗?“保存有主分类页面连接”,就像一般的网站上的网站地图或者网站导航一样,把主要的栏目,频道都列出来。。
ccterran 2004-05-13
  • 打赏
  • 举报
回复
首页-->子页1-->子页11-->子页111 ...
-->子页112 ...
-->子页113 ...
子页12 ...

子页2-->子页21 ...
-->子页22 ...
-->子页33 ...

但好像楼主要的并不是这样。。。
zzhhll003 2004-05-13
  • 打赏
  • 举报
回复
那么请教一下(唠叨) 老大,这种网站地图该如何建呢?
zzhhll003 2004-05-13
  • 打赏
  • 举报
回复
呵呵,我也挺想知道。
xuzuning 2004-05-13
  • 打赏
  • 举报
回复
这个问题是这样实现的:
1、构造一个基本页,其中保存有主分类页面连接。可利用网站的“网站地图”页
2、搜索时,读取该页分析出其中的连接并打开分析,如此循环
3、对每个后续页面均检查<meta name=”keywords” content=”网站内容关键字”>
标记是否含有待查找关键字,如有则暂存备后续处理

google就是这么做的,只是他使用专门的软件,昼夜不停的扫描intrnet。并把结果分门别类的保存在他的硬盘组里。当你使用google时,他是从硬盘组中检索,而非直接在intrnet上查找
ccterran 2004-05-13
  • 打赏
  • 举报
回复
利用google的站内搜索,只能搜索google已经收集到的该站的内容,而这只是一小部分,并不是真正的全站搜索
hahawen 2004-05-13
  • 打赏
  • 举报
回复
说个其他的方法(应该可以,我以前作过的,当时是免费用的,现在不知道了):

利用google的“站内搜索”功能,可以到网上找一下相关的资料,挺简单的。
efanlx 2004-05-13
  • 打赏
  • 举报
回复
不搜索数据库,而要实现搜索全部新闻,我也想知
ccterran 2004-05-13
  • 打赏
  • 举报
回复
不搜索数据库,而要实现搜索全部新闻,那就要遍历全部目录和文件,然后读取文件内容,和搜索关键字进行匹配。我想这你应该已经想到了。

也可以根据meta里的keywords,定期做一个索引,让访问者搜索的是这些关键字,这样就快一些。但估计准确度不高。
gowuliao 2004-05-13
  • 打赏
  • 举报
回复
我的想法是:我也想知道.呵呵.
asssa117 2004-05-13
  • 打赏
  • 举报
回复
首页-->子页1-->子页11-->子页111 ...
-->子页112 ...
-->子页113 ...
子页12 ...

子页2-->子页21 ...
-->子页22 ...
-->子页33 ...
=================================
得到这样的页面后我怎么才能把其中的相关新闻取出来呢?
我想利用<meta name=”keywords” content=”网站内容关键字”>,怎么做?
zzhhll003 2004-05-13
  • 打赏
  • 举报
回复
那网站地图是不是这样做的:
先在页面中做一个文本代码搜索把所有的超链接语句都搜到,然后存放在某一位子(比如数拒库的某个表中),最后把它在某一个页面中都列出来,是这样吗?不知道我理解得对不对?
cloudchen 2004-05-13
  • 打赏
  • 举报
回复
nt平台上ms有自带的indexing服务,可以实现文件系统的全文检索。
数据库系统的全文检索一般数据库软件都提供。
不知道linux平台上有没有相应的文件系统的全文检索?
《概率论与数理统计》是理工科大学中的一门重要基础课程,它结合了概率论的基本理论与统计学的方法,用于分析和处理随机现象。第二版的完整版多媒体教学系统旨在通过丰富的教学资源和互动体验,帮助学生深入理解和掌握这门学科的核心概念。 一、概率论基础 概率论是研究随机事件及其规律性的数学理论,主要包括以下几个关键概念: 1. 随机试验:概率论的研究对象,如掷骰子、抽卡等。 2. 样本空间:所有可能结果的集合。 3. 事件:样本空间的子集,代表某种特定的结果。 4. 概率:事件发生的可能性,通常介于0和1之间,表示为P(A)。 5. 条件概率:在已知某个事件发生的情况下,另一个事件发生的概率。 6. 乘法法则和加法法则:用于计算两个独立或不独立事件的概率。 二、概率分布 1. 离散概率分布:如二项分布、泊松分布、几何分布、超几何分布等,用于描述离散随机变量的分布情况。 2. 连续概率分布:如均匀分布、正态分布、指数分布等,适用于连续随机变量。 三、统计学基础 1. 参数估计:通过样本数据估计总体参数,如均值、方差等。 2. 抽样分布:统计量在多次重复抽样下的分布情况。 3. 点估计和区间估计:给出参数的一个估计值或一个估计范围。 4. 假设检验:检验关于总体参数的假设是否成立,如t检验、卡方检验、F检验等。 5. 回归分析:研究两个或多个变量间的关系,预测一个变量基于其他变量的值。 四、数理统计方法 1. 最大似然估计:寻找使样本数据出现概率最大的参数估计方法。 2. 矩估计:通过总体矩与样本矩的关系来估计参数。 3. 正态分布的中心极限定理:大量独立随机变量的和近似服从正态分布,即使这些变量本身非正态。 4. 协方差和相关系数:衡量两个随机变量之间线性关系的强度和方向。 5. 方差分析(ANOVA):比较多个组别间的均值差异。 五、多元统计分析 1. 多元正态分布:多维空间中的正态分布,常用于多元线性回归。 2. 判别分析:根据已知分类的样本数据,建立判别函数,对新数据进行分类。 3. 聚类分析:将相似数据分组,揭示数据内在结构。 4. 主成分分析(PCA):降低数据维度,提取主要特征。 六、多媒体教学系统 该教学系统可能包含以下组成部分: 1. 视频讲座:专家讲解理论和例题,直观展示概念。 2. 动画演示:动态模拟随机过程,帮助理解概率模型。 3. 交互式练习:提供习题和答案,实时反馈学习效果。 4. 实验教程:设计数学实验,让学生亲手操作,加深理解。 5. 电子教材:包含文字、图表、案例等丰富内容,便于自主学习。 通过这个多媒体教学系统,学生不仅可以学习到概率论与数理统计的理论知识,还能通过实践应用和互动学习,提升解决实际问题的能力。

21,891

社区成员

发帖
与我相关
我的任务
社区描述
从PHP安装配置,PHP入门,PHP基础到PHP应用
社区管理员
  • 基础编程社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧