CSDN论坛 > 扩充话题 > 灌水乐园

这就是艺术!?!?! [问题点数:1分,结帖人xiaoya371]

Bbs2
本版专家分:360
结帖率 100%
CSDN今日推荐
Bbs7
本版专家分:13935
Bbs2
本版专家分:142
Bbs2
本版专家分:293
Bbs6
本版专家分:8261
Bbs2
本版专家分:142
Bbs7
本版专家分:15000
Blank
微软MVP 2005年7月 荣获微软MVP称号
2006年7月 荣获微软MVP称号
Blank
红花 2005年4月 Web 开发大版内专家分月排行榜第一
Blank
黄花 2005年2月 硬件使用大版内专家分月排行榜第二
Blank
蓝花 2006年5月 Web 开发大版内专家分月排行榜第三
2005年12月 Web 开发大版内专家分月排行榜第三
2005年5月 Web 开发大版内专家分月排行榜第三
2004年10月 Web 开发大版内专家分月排行榜第三
2004年9月 Web 开发大版内专家分月排行榜第三
Bbs7
本版专家分:11149
Bbs2
本版专家分:410
Bbs5
本版专家分:4704
Bbs4
本版专家分:1150
Bbs4
本版专家分:1653
Bbs1
本版专家分:50
Bbs3
本版专家分:626
Bbs6
本版专家分:7045
Bbs7
本版专家分:13538
Bbs3
本版专家分:589
Bbs4
本版专家分:1524
匿名用户不能发表回复!
其他相关推荐
《这就是搜索引擎:核心技术详解》读书笔记
学Java的时候也顺便看了一下网上的一个爬虫的源码,感觉看完了收获也很有限,只是大概了解了一下其基本思路:从用户添加的种子URL作为起点,不断请求web页面,然后从页面中提取出新的URL,添加到爬取队列中,其中穿插有URL去重和正则表达式匹配等操作,最后到达指定层数后停止。   之后感觉用这东西去爬爬网页什么的也没什么意思,更多的东西在于用它来做什么应用了,于是也没有深究。   之前去腾讯面试,
这就是搜索引擎_核心技术详解+-+张俊林.mobi
书名:这就是搜索引擎:核心技术详解 定价:45.00元 作者:张俊林 著 出版社:电子工业出版社 出版日期:2012-01-01
这就是搜索引擎-核心技术详解.pdf
内容简介编辑 搜索引擎作为互联网发展中至关重要的一种应用,已经成为互联网各个领域的制高点,其重要性不言而喻。搜索引擎领域也是互联网应用中不多见的以核心技术作为其命脉的领域,搜索引擎各个子系统是如何设计的?这成为广大技术人员和搜索引擎优化人员密切关注的内容。 本书的最大特点是内容新颖全面而又通俗易懂。对于实际搜索引擎所涉及的各种核心技术都有全面细致的介绍,除了作为搜索系统核心的网络爬虫、索引系统、排序系统、链接分析及用户分析外,还包括网页反作弊、缓存管理、网页去重技术等实际搜索引擎必须关注的技术,同时用相当大的篇幅讲解了云计算与云存储的核心技术原理。另外,本书也密切关注搜索引擎发展的前沿技术:Google的咖啡因系统及Megastore等云计算新技术、百度的暗网抓取技术阿拉丁计划、内容农场作弊、机器学习排序等。诸多新技术在相关章节都有详细讲解,同时对于社会化搜索、实时搜索及情境搜索等搜索引擎的未来发展方向做了技术展望。为了增进读者的理解,全书大量引入形象的图片来讲解算法原理,相信读者会发现原来搜索引擎的核心技术理解起来比原先想象的要简单得多。[1-2] 目录编辑 目 录 第1章 搜索引擎及其技术架构 1 1.1 搜索引擎为何重要 1 1.1.1 互联网的发展 1 1.1.2 商业搜索引擎公司的发展 3 1.1.3 搜索引擎的重要地位 3 1.2 搜索引擎技术发展史 4 1.2.1 史前时代:分类目录的一代 4 1.2.2 第一代:文本检索的一代 5 1.2.3 第二代:链接分析的一代 5 1.2.4 第三代:用户中心的一代 5 1.3 搜索引擎的3个目标 6 1.4 搜索引擎的3个核心问题 7 1.4.1 3个核心问题 7 1.4.2 与技术发展的关系 8 1.5 搜索引擎的技术架构 9 第2章 网络爬虫 12 2.1 通用爬虫框架 12 2.2 优秀爬虫的特性 15 2.3 爬虫质量的评价标准 18 2.4 抓取策略 19 2.4.1 宽度优先遍历策略(Breath First) 20 2.4.2 非完全PageRank策略(Partial PageRank) 21 2.4.3 OCIP策略(Online Page Importance Computation) 23 2.4.4 大站优先策略(Larger Sites First) 23 2.5 网页更新策略 23 2.5.1 历史参考策略 24 2.5.2 用户体验策略 24 2.5.3 聚类抽样策略 24
《这才是马云》读书笔记
今天读完了《这才是马云》这本书,感觉这本书挺逗的,本来以为是一本普普通通的人物传记,借的时候看到书的作者是马云的助理,感觉应该能描写一个最为真实的马云。事实上的确如此,通过这本书,我认识了一个不一样的马云,同时,作者还写了很多自己以及张纪中的事,看了一本传记,相当于看了三个人的传记,赚了。 作者的写作风格很幽默,看这本书一点都不感觉到枯燥,甚至有时候就像一本笑话书,看着看着就忍不住笑
这就是搜索引擎:核心技术详解.pdf 高清版 带目录
这就是搜索引擎:核心技术详解.pdf 高清版 带目录 这就是搜索引擎:核心技术详解.pdf 高清版 带目录 个人收集电子书,仅用学习使用,不可用于商业用途,如有版权问题,请联系删除!
读书笔记 ▏ggplot2数据分析与图形艺术Ch.1-2
读书笔记 ▏ggplot2数据分析与图形艺术Ch.1-2
这就是搜索引擎 - 张俊林(Epub 版本)
搜索引擎作为互联网发展中至关重要的一种应用,已经成为互联网各个领域的制高点,其重要性不言而喻。搜索引擎领域也是互联网应用中不多见的以核心技术作为其命脉的领域,搜索引擎各个子系统是如何设计的?这成为广大技术人员和搜索引擎优化人员密切关注的内容。 本书的最大特点是内容新颖全面而又通俗易懂。对于实际搜索引擎所涉及的各种核心技术都有全面细致的介绍,除了作为搜索系统核心的网络爬虫、索引系统、排序系统、链接分析及用户分析外,还包括网页反作弊、缓存管理、网页去重技术等实际搜索引擎必须关注的技术,同时用相当大的篇幅讲解了云计算与云存储的核心技术原理。另外,本书也密切关注搜索引擎发展的前沿技术:Google的咖啡因系统及Megastore等云计算新技术、百度的暗网抓取技术阿拉丁计划、内容农场作弊、机器学习排序等。诸多新技术在相关章节都有详细讲解,同时对于社会化搜索、实时搜索及情境搜索等搜索引擎的未来发展方向做了技术展望。为了增进读者的理解,全书大量引入形象的图片来讲解算法原理,相信读者会发现原来搜索引擎的核心技术理解起来比原先想象的要简单得多。
禅与摩托车维修艺术语录摘抄(1)
佛陀或是耶稣坐在电脑和变速器的齿轮旁边修行会想坐在山顶和莲花座上一样自在。如果情形不是如此,那无疑于亵渎佛陀——也就是亵渎了你自己。我认为只有在情绪不对的时候,身体上的不适才更加明显,那时你就会把不适的原因归咎于环境。但是如果情绪很正常的话,身体上的不适就无关紧要了。他们动作的速度是另外一条线索,他们阿布东西导出丢,而且也不记得丢在那里。如果你不反省一番,你就不知道这样做往往会浪费时间,而且成效不佳
只言片语 —— eFPGA
科学就是那些我们能对计算机说明白的东西,余下的都叫艺术。 ——高德纳从读书开始时的EPLD到大学毕业时的FPGA,一晃多年,仿若回到原点,只是很多的技能都似随风而逝,现在从IoT领域试图找回一些原来的...
《这就是搜索引擎-核心技术详解》简单梳理+一些知识图谱的知识
《这就是搜索引擎-核心技术详解》,我挺喜欢这本书的,深入浅出让读者明白一个搜索引擎的大体架构和各个部分的经典技术手段。一、相关概念(1)搜索引擎的3个核心问题: 理解用户真正的需求(主要第九章用户查询意图分析,再一个是情景搜索,即此时此地此人,获取用户发生查询的时间、地点、周围环境等+之前的用户模型,根本目的还是要理解当前用户当前情境下的需求) 判断相关性,目前主要是基于关键词的匹配,VSM+TF*
关闭
关闭