社区
Java SE
帖子详情
请教 “各个搜索引擎的设计原理和实现方式”
zmrljl
2003-07-26 09:29:35
谢谢!例如:google,sohu,sina,yahoo
...全文
44
6
打赏
收藏
请教 “各个搜索引擎的设计原理和实现方式”
谢谢!例如:google,sohu,sina,yahoo
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
6 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
star821116
2003-07-26
打赏
举报
回复
关于google的搜索算法,我记得程序员2002年合订本和03年4期还是5期上有介绍,
sina好像就是基于google的搜索引擎
gdh_zj
2003-07-26
打赏
举报
回复
我我猜测:
google有一个后台扫描程序,按某种策略从1.0.0.1---254.254.254.254扫描主机的80端口;
如果开放,则获取html代码,分析程序对html进行语法分析,把title,href,meta之类的文本和连接放入数据库...
当然google的后台完全是分布式的,算法也非常复杂...
leonzhao
2003-07-26
打赏
举报
回复
sohu,sina没有自己的技术的。
hero3_cc
2003-07-26
打赏
举报
回复
算法不清楚,
设计原理应该就是网络机器人,可以去搜索一下“网络机器人”原理。
北极猩猩
2003-07-26
打赏
举报
回复
回去查程序员吧,上面有google的作者在97年国际互联网大会上的论文
keyinwind
2003-07-26
打赏
举报
回复
我听说google对每次搜索初始化一个含有50亿个参数的方程组,计算后就得到了搜索列表
好象非常非常复杂,去问问国外的数学家估计会告诉你答案,搜索算法非常非常复杂。
搜索引擎
【概念】
搜索引擎
(search engine)是指根据一定的策略、运用特定的计算机程序搜集互联网上的信息,在对信息进行组织和处理后,为用户提供检索服务的系统。从使用者的角度看,
搜索引擎
提供一个包含搜索框的页面,在...
001基于Python网站爬虫的
设计
与
实现
1.1 课题背景网络爬虫,是一种按照一定的规则,自动的抓取万维网信息的程序或者脚本。...最初的检索功能通过索引站的
方式
实现
,而有了网络机器人。但是,这些通用性
搜索引擎
也存在着一定的局限性。
图片搜索的
原理
Google 图片搜索的
原理
是什么? 1 条评论 分享 按投票排序按时间排序 18 个回答 389赞同反对,不会显示你的姓名 知乎用户,安全行业 XsXs、知乎用户、知乎用户等人赞同 ...
毕业
设计
001基于Python网站爬虫的
设计
与
实现
1.1 课题背景网络爬虫,是一种按照一定的规则,自动的抓取万维网信息的程序或者脚本。...最初的检索功能通过索引站的
方式
实现
,而有了网络机器人。但是,这些通用性
搜索引擎
也存在着一定的局限性。
阿里P8架构师谈:数据库分库分表、读写分离的
原理
和
实现
,以及使用场景
读写分离的
原理
和
实现
1、什么是读写分离 读写分离,基本的
原理
是让主数据库处理事务性增、改、删操作(INSERT、UPDATE、DELETE),而从数据库处理SELECT查询操作。数据库复制被用来把事务性操作导致的变更同步到...
Java SE
62,614
社区成员
307,327
社区内容
发帖
与我相关
我的任务
Java SE
Java 2 Standard Edition
复制链接
扫一扫
分享
社区描述
Java 2 Standard Edition
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章