像百度、google出来一个新词是怎么做到马上就能准确搜索到的呢?

艾小仙 2013-02-25 11:10:36
现在我使用的搜索框架是solr,如果出现新词,肯定是搜的不准确的,那这时候就只能往词库里填数据了。
但是有个问题,修改了词库,肯定得重启服务器才能生效,那百度、google是怎么做到这一点的呢?
个人比较费解,有没有大牛知道啊。求解释
...全文
179 2 打赏 收藏 转发到动态 举报
写回复
用AI写文章
2 条回复
切换为时间正序
请发表友善的回复…
发表回复
艾小仙 2013-02-25
  • 打赏
  • 举报
回复
引用 1 楼 wzs_xyz 的回复:
百度那种搜索不是依赖的词库 而是用类似爬虫的方式,用千千万万的小爬虫,尝试请求网页以及网页里面的每一个链接,获取到响应,当你搜索时就可以解析这些内容,看是否包含搜索内容
这样啊,我看也有一些网站的搜索是用solr做的,那他们依赖词库是怎么做到的呢?
未知数 2013-02-25
  • 打赏
  • 举报
回复
百度那种搜索不是依赖的词库 而是用类似爬虫的方式,用千千万万的小爬虫,尝试请求网页以及网页里面的每一个链接,获取到响应,当你搜索时就可以解析这些内容,看是否包含搜索内容
特色功能: 1、强大词库:海量词库,第一时间收录最in新词; 2、中英混合输入:无需切换,中英文随意输入; 3、搜索建议功能:无需输入全部关键词,可直接在浏览器中搜索; 4、支持全拼、简拼两种输入模式; 5、云输入功能提供更准确候选词; 6、网址、邮箱地址输入模式; 7、模糊音功能; 8、自定义候选项个数功能; 为改进百度输入法软件质量,为用户提供更优质的服务,现百度输入法提供“加入用户体验改善计划”供用户选择。在安装百度输入法时,用户可以选择是否勾选"加入用户体验改善计划"的选项。如果用户选择了“加入用户体验改善计划”,即表示用户自愿选择向百度提供相关使用信息,百度输入法会定时或不定时地向百度公司发送关于用户的操作过程与输入内容等与使用相关的信息。该等信息将只被用于进行统计意义上的分析,以便百度进一步改进百度输入法,或者提供其他新的产品或服务。安装后,用户也可以随时在百度输入法的【属性设置】→【高级设置】中关闭或打开该选项。 依照我国有关法律法规规定,本计划对有关信息的收集是完全匿名的,不会收集用户的姓名、地址、密码或任何其他有助于识别个人身份的标识信息。并且,除非为了遵守我国法律法规的规定或根据相关政府主管部门的要求,百度公司不会将涉及用户的个人信息提供给任何第三方。
EOS 是由 Block.one 公司开发的一个新的区块链软件系统,它的目标是将一切去中心化(decentralize everything)。从 2017 年年中开始,经过一年的代币众筹后,它于 2018 年 6 月 15 通过由数十个区块生产者(block producer,BP,又称超级节点)组成的社区上线了主网,EOS 主网这条主要的区块链开始正式运转。 通过 EOS Tracker 可以查看 EOS 区块链网络(EOS 主网)的情况。 要注意,虽然有一个 EOS 主网,但实际情况要复杂得多,任何人都可以用 EOS 提供的 EOSIO 开源软件建立自己的一条链,且 EOS 鼓励开发者这么。接下来,我们分几个主题介绍 EOS 这个基础公链和它的应用开发。EOS 这个基础公链可说是为应用而生的。EOS VS 以太坊了解 EOS 的方式之一是拿它与以太坊、比特币进行比较。 从开发目标上来讲,比特币、以太坊、EOS 是渐进的,分别是区块链 1.0、区块链 2.0、区块链 3.0,重心分别是货币、合约、应用。以太坊在实际应用中是以通证为主的。以太坊、EOS 均是借鉴与延续之前的思路重新开发,以太坊是比特币的改进,EOS 是以太坊的改进。 这里先用比喻的方式来对比比特币、以太坊、EOS,见下图。 比特币的设计思路类似于黄金。在数字世界中,按工作量证明共识机制,挖矿节点进行加密计算,获得比特币形式的挖矿奖励。挖矿节点也可以获得交易费收益,不过,虽然在比特币网络中的资产价值高,但交易并不频繁,交易费收益目前在矿工收益中的占比并不高。 以太坊的设计思路类似于高速公路。在这条收费高速公路上,车辆行驶需要付费。它早期募集资金,建设“高速公路”,早期投资者享有“高速公路”的主要权益。之后,一起建设与维护“高速公路”的挖矿节点也可以获得挖矿奖励与交易费收益。在以太坊网络中,由于各类项目已经基于它生成了大量的通证,以太坊网络的交易量相对较多,挖矿节点获得的交易费收益占比高于比特币。 EOS 的设计思路则类似于房地产开发。Block.one 公司在将土地售卖出去之后,逻辑上它用获得的资金进行基础的开发,此后每年再以类似填海造田的方式增加 5% 的土地出来。 EOS 的繁荣主要取决于,已经竞购得到大量土地的开发商是不是开发和经营好自己的地块?EOS 网络要依靠超级节点(即区块生产者)来各自建设、共同运营,按现在的设计,这些节点共同获得每年 1% 新增发的 EOS 作为回报。 与以太坊不同,EOS 网络的设计是不再收取网络交易费,持有 EOS 通证则拥有对应的网络使用权利。但是,如果一个应用的开发者不持有足够的 EOS 通证,可能就要从市场中购买和付费租用,以获得使用主网的权利。类比来看,这种设计类似于购买或租用办公楼。 当然,以上用比喻的方式讨论只是为了便于理解。EOS 实际的情况是:Block.one 公司募集资金开发一个名为 EOSIO 的开源软件。EOS 社区用这个软件来运行 EOS 主网,且从逻辑上来讲,这个主网并非由 Block.one 公司运行,而是由社区运行的。另外,其他人也用 EOSIO 这个开源软件建立替代网(altnet)。 替代网(altnet)是一个模仿替代币(altcoin)而创造出来的新词。在社区运行的 EOS 主网(mainnet)之外,EOS 鼓励其他人用 EOSIO 开源软件架设新的区块链网络,这些区块链网络是类似于替代币的替代网。比特币的替代币是与比特币的价值无关的,类似地,替代网也与 EOS 主网无关。EOS 是对以太坊的改进,各个用 EOSIO 开源软件运行起来的区块链网络,可以几乎所有以太坊能的事,如编写智能合约、发行通证。为什么 EOS 有超级节点竞选EOS 所采用的共识机制是 DPOS(委托权益证明),即一些节点在获得足够多的投票支持后,成为见证人(witness)节点或 EOS 中所说的区块生产者(BP,也称超级节点),负责区块链的区块生成。 对于比特币系统,任何人都可以接入网络,以算力竞争记账权利,生成区块。而对于 EOS,只有超级节点才有资格生产区块。这是因为两者所采用的共识机制不同:比特币和以太坊采用的是工作量证明共识机制,而 EOS 采用的是 DPOS(委托权益证明)共识机制。 围绕 POW 与 DPOS 的比较,讨论主要集中在能源消耗、效率、安全等方面。但我们也可以从去中心网络形成的角度来看,为什么 DPOS 是一种可行的选择。 基于区块链的思路开发的软件系统有以下三个关键要求:一是性能。它的去中心网络的整体性能能否支撑大量应用?

24,923

社区成员

发帖
与我相关
我的任务
社区描述
Web 开发 Apache
社区管理员
  • Apache
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧