深度学习 最全的中文版 deep learning下载 [问题点数:0分]

Bbs1
本版专家分:0
Blank
脉脉勋章 绑定脉脉第三方账户获得
结帖率 70.98%
深度学习Deep Learning 》中文版 高清完整PDF版 下载
<em>深度学习</em>Deep Learning <em>中文版</em>
Python深度学习(Deep Learning With Python中文版
本书由Keras之父、现任Google人工智能研究员的弗朗索瓦•肖莱(François Chollet)执笔,详尽介绍了用Python和Keras进行<em>深度学习</em>的探索实践,包括计算机视觉、自然语言处理、产生式模型等应用。书中包含30多个代码示例,步骤讲解详细透彻。由于本书立足于人工智能的可达性和大众化,读者无须具备机器学习相关背景知识即可展开阅读。在学习完本书后,读者将具备搭建自己的<em>深度学习</em>环境、建立图像识别模型、生成图像和文字等能力。
深度学习Deep Learning 》中文版 高清完整PDF版带目录
本书包括3 个部分:第1 部分介绍基本的数学工具和机器学习的概念,它们是<em>深度学习</em>的预备知识;第2 部分系统深入地讲解现今已成熟的<em>深度学习</em>方法和技术;第3 部分讨论某些具有前瞻性的方向和想法,它们被公认为是<em>深度学习</em>未来的研究重点。 本书适合各类读者阅读,包括相关专业的大学生或研究生,以及不具有机器学习或统计背景、但是想要快速补充<em>深度学习</em>知识,以便在实际产品或平台中应用的软件工程师。 目录 第1部分 应用数学与机器学习基础 第2章 线性代数 第3章 概率与信息论 第4章 数值计算 第5章 机器学习基础 第2部分 深层网络:现代实践 第6章 深度前馈网络 第7章 <em>深度学习</em>中的正则化 第8章 深度模型中的优化 第9章 卷积网络 第10章 序列建模:循环和递归网络 第11章 实践方法论 第12章 应用 第3部分 <em>深度学习</em>研究 第13章 线性因子模型 第14章 自编码器 第15章 表示学习 第16章 <em>深度学习</em>中的结构化概率模型 第17章 蒙特卡罗方法 第18章 直面配分函数 第19章 近似推断 第20章 深度生成模型
Deeplearning中文版
压缩包中是Deep<em>learning</em>的<em>中文版</em>,PDF版本,非常清晰,适合<em>深度学习</em>专业方向的读者阅读。
Neural Networks and Deep Learning神经网络与深度学习中文版
⼀个以原理为导向的⽅法,本书⼀个坚定的信念,是让读者更好地去深刻理解神经⽹络和<em>深度学习</em>,⽽不是像⼀张冗⻓的洗⾐单⼀样模糊地列出⼀堆想法。如果你很好理解了核⼼理念,你就可以很快地理解其他新的推论。⽤编程语⾔对⽐,把这理解为掌握⼀种新语⾔的核⼼语法、库和数据结构。你可能仍然只是 “知道” 整个编程语⾔的⼀⼩部分—许多编程语⾔有巨⼤的标准库—但新的库和数据结构可以很快且容易被理解。这就意味着这本书的重点不是作为⼀个如何使⽤⼀些特定神经⽹络库的教程。如果你主要想围绕着某个程序库的⽅式去学习,那不要读这本书!找到你想学习的程序库,并通过教程和⽂档来完成。注意这点。虽然这也许能很快解决你的问题,但是,如果你想理解神经⽹络中究竟发⽣了什么,如果你想要了解今后⼏年都不会过时的原理,那么只是学习些热⻔的程序库是不够的。你需要领悟让神经⽹络⼯作的原理。技术来来去去,但原理是永恒的。 ⼀个动⼿实践的⽅法 我们将通过攻克⼀个具体的问题:教会计算机识别⼿写数字的问题,来学习神经⽹络和<em>深度学习</em>的核⼼理论。这个问题⽤常规的⽅法来编程解决是⾮常困难的。然⽽,正如我们所看到的,它可以很好地利⽤⼀个简单的神经⽹络来解决,只需⼏⼗⾏代码,没有特别的库。更多的是,我们会通过多次迭代来改进程序,逐步融⼊神经⽹络和<em>深度学习</em>的核⼼思想。 这⼀动⼿的⽅法意味着你需要⼀些编程经验来阅读这本书。但你不必是⼀个专业的程序员。我⽤ Python(2.7 版)写了代码,即使你不是⽤ Python 编程,努⼒⼀下也应该很容易理解。通vii过这本书,我们将开发⼀个⼩的神经⽹络库,它可以⽤来实验和建⽴理解。所有的代码都可以在这⾥<em>下载</em>。⼀旦你完成了这本书,或者你读它,你可以轻松地学会⼀个功能更加完善的神经⽹络库⽤于⽣产
deepLearning with python pdf(中文版)免费下载!!
如今这世道,唉!想<em>下载</em>一个文件,这里要金币,那里要人民币,老子就是不付。作为一名程序员当然要有奉献的精神,在经过我一番寻找之后,终于找到了,下面把链接提供给大家。nn在线阅读:https://github.com/exacity/<em>deep</em><em>learning</em>book-chinesennpdf<em>下载</em>:https://github.com/exacity/<em>deep</em><em>learning</em>book-chin...
《DEEP LEARNING》中文版 超清扫描PDF版本
书名:DEEP LEARNING 作者:Ian Goodfellow, Yoshua Bengio, Aaron Courville 中文书名:《<em>深度学习</em>》 目录: 第一章(引言) 第二章(线性代数) 第三章(概率与信息论) 第四章(数值计算) 第五章(机器学习基础) 第六章(深度前馈网络) 第七章(<em>深度学习</em>中的正则化) 第八章(深度模型中的优化) 第九章(卷积网络) 第十章(序列建模:循环和递归网络 第十一章(实践方法论) 第十二章(应用) 第十三章(线性因子模型) 第十五章(表示学习) 第十六章(<em>深度学习</em>中的结构化概率模型) 第十八章(直面配分函数) 第十九章(近似推断) 第二十章(深度生成模型)
深度学习(deep learning) AI圣经 中文+高清+目录
《<em>深度学习</em>》由全球知名的三位专家Ian Goodfellow、Yoshua Bengio 和Aaron Courville撰写,是<em>深度学习</em>领域奠基性的经典教材。全书的内容包括3个部分:第 1部分介绍基本的数学工具和机器学习的概念,它们是<em>深度学习</em>的预备知识;第 2部分系统深入地讲解现今已成熟的<em>深度学习</em>方法和技术;第3部分讨论某些具有前瞻性的方向和想法,它们被公认为是<em>深度学习</em>未来的研究重点。 《<em>深度学习</em>》适合各类读者阅读,包括相关专业的大学生或研究生,以及不具有机器学习或统计背景、但是想要快速补充<em>深度学习</em>知识,以便在实际产品或平台中应用的软件工程师。
Deep Learning Book (深度学习)中文版高清.pdf版下载
Yoshua Bengio著的<em>深度学习</em>权威著作,张志华翻译版
深度学习Deep Learning with Python 2017 高清完整pdf原版
<em>深度学习</em> Deep Learning with Python 2017 经典的<em>深度学习</em>教程。强烈推荐<em>下载</em>学习。最新的<em>深度学习</em>教程。 这本书向您介绍了<em>深度学习</em>的桥梁框架如keras实践的学术现状和工业国家之间的差距。 本书简要介绍了深层学习的数学前提和基本原理,使本书成为希望深入学习的软件开发人员的良好起点。还包括了一个简短的深入学习架构的调查。 使用Python进行深入学习还将介绍自动微分和GPU计算的关键概念,而在深入进行大规模实验时,这并不是深入学习的核心概念。 Discover the practical aspects of implementing <em>deep</em>-<em>learning</em> solutions using the rich Python ecosystem. This book bridges the gap between the academic state-of-the-art and the industry state-of-the-practice by introducing you to <em>deep</em> <em>learning</em> frameworks such as Keras, Theano, and Caffe. The practicalities of these frameworks is often acquired by practitioners by reading source code, manuals, and posting questions on community forums, which tends to be a slow and a painful process. Deep Learning with Python allows you to ramp up to such practical know-how in a short period of time and focus more on the domain, models, and algorithms. This book briefly covers the mathematical prerequisites and fundamentals of <em>deep</em> <em>learning</em>, making this book a good starting point for software developers who want to get started in <em>deep</em> <em>learning</em>. A brief survey of <em>deep</em> <em>learning</em> architectures is also included. Deep Learning with Python also introduces you to key concepts of automatic differentiation and GPU computation which, while not central to <em>deep</em> <em>learning</em>, are critical when it comes to conducting large scale experiments.
深度学习 deep learning pdf AI圣经.pdf下载 中文版 带封面
AI圣经!<em>深度学习</em>领域奠基性的经典畅销书!长期位居美国亚马逊AI和机器学习类图书榜首!所有数据科学家和机器学习从业者的必读图书!
2018新书+源码:Python深度学习(Deep Learning With Python中文版)高清无损
本书由 Keras 之父、现任 Google 人工智能研究员的弗朗索瓦 • 肖莱(François Chollet)执笔,详尽介 绍了用 Python 和 Keras 进行<em>深度学习</em>的探索实践,涉及计算机视觉、自然语言处理、生成式模型等应用。
经典教材Deep Learning 深度学习中英文完整版(彩色高清)
经典教材Deep Learning <em>深度学习</em>中英文完整版(彩色高清),<em>深度学习</em>必读书籍,彩色高清,体验很棒!
《Python深度学习》(Deep Learning With Python中文版)和英文版+源码哦
本书由Keras之父、现任Google人工智能研究员的弗朗索瓦•肖莱(François Chollet)执笔,详尽介绍了用Python和Keras进行<em>深度学习</em>的探索实践,包括计算机视觉、自然语言处理、产生式模型等应用。书中包含30多个代码示例,步骤讲解详细透彻。由于本书立足于人工智能的可达性和大众化,读者无须具备机器学习相关背景知识即可展开阅读。在学习完本书后,读者将具备搭建自己的<em>深度学习</em>环境、建立图像识别模型、生成图像和文字等能力。
神经网络和深度学习(Neural Networks and Deep Learning) 中文pdf完整版
内容为时下最火热的神经网络和<em>深度学习</em>,该教程来源于美国Michael Nielsen的个人网站,他致力于把神经网络与<em>深度学习</em>的高深知识以浅显易懂的方式讲解出来,成为众多大牛推荐的必读网络资源之一。国内有识之士把其翻译成中文,方便了广大读者。是不可多得的优质资料! 文章理论坚实,公式推导逻辑严谨,思路清晰,绝对是广大<em>深度学习</em>爱好者的入坑神器。本资源为高清完整版 <em>深度学习</em>是机器学习的一个分支。受人类大脑的启发,人工神经网络(ANN)从上世纪40、50年代发展。<em>深度学习</em>是多层人工神经网络的组合,在40年前,人工神经网络只有2层深,不足以构建大型网络,现在少则十层多则百层。<em>深度学习</em>主要得益大数据和云计算的出现,是目前机器学习最火的领域。 章节 第一章:使用神经网络识别手写数字(MINIST) 第二章:反向传播算法是怎么工作的 第三章:改进神经网络的学习方法 第四章:神经网络可以做任何计算的可视化证明 第五章:深度神经网络为何很难训练 第六章:<em>深度学习</em> 。。。。。。。
Neural+Networks+and+Deep+Learning-神经网络与深度学习.pdf中文完整版
Neural+Networks+and+Deep+Learning-神经网络与<em>深度学习</em>.pdf中文完整版
Deep Learning 中文版已经有了,在GitHub上开源
       最近在看Ian Goodfellow、Yoshua Bengio、Aaron Courville 写的Deep Learning ,但是发现读起来比较慢,就着了一下有没有<em>中文版</em>,结果发现在GitHub上就有开源的pdf<em>下载</em>。       网址为:https://github.com/exacity/<em>deep</em><em>learning</em>book-chinese...
DEEP LEARNING 深度学习 中文高清珍藏版.包含源代码
本资源包含 高清PDF 和源代码 《Deep Learning》(<em>深度学习</em>)是一本皆在帮助学生和从业人员进入机器学习领域的教科书,以开源的形式免费在网络上提供,这本书是由学界领军人物 Ian Goodfellow、Yoshua Bengio 和 Aaron Courville 合力打造。
深度学习Deep Learning with Python 》2017 高清完整PDF版 A Hands-on Introduction
Deep Learning with Python: A Hands-on Introduction , 作者: Nikhil Ketkar
【高清完整】深度学习(Deep Learning)中文版.pdf下载
本书是《<em>deep</em> <em>learning</em>》的中文翻译版,适用于初学者和欲更深入学习的科研人员
deep learning 深度学习中文版+英文版 高清 pdf
<em>deep</em> <em>learning</em> <em>深度学习</em><em>中文版</em>+英文版 pdf,包含2本高清pdf
Deep learning with python(中文版
keras教父大作,这个资料是英文版本对应的中文高清翻译版本,里面都是彩图的。
Neural Networks and Deep Learning-神经网络与深度学习(中英文两个版本)
Neural Network and Deep Learning 神经网络与<em>深度学习</em><em>中文版</em>和英文版两个版本,可以两个一起参考使用,<em>深度学习</em>不错的入门书籍
深度学习基础(Fundamentals of Deep Learning)高清完整PDF版
<em>深度学习</em>基础(Fundamentals of Deep Learning) by Nikhil Buduma
深度学习Deep Learning 中文版(高清扫描带目录版)
目录 · · · · · · 第 1 章 引言 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.1 本书面向的读者 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .7 1.2 <em>深度学习</em>的历史趋势 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 1.2.1 神经网络的众多名称和命运变迁 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 1.2.2 与日俱增的数据量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 1.2.3 与日俱增的模型规模 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .13 1.2.4 与日俱增的精度、复杂度和对现实世界的冲击 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 第 1 部分 应用数学与机器学习基础 第 2 章 线性代数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 2.1 标量、向量、矩阵和张量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 2.2 矩阵和向量相乘. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .21 2.3 单位矩阵和逆矩阵 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 2.4 线性相关和生成子空间 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 2.5 范数. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .24 2.6 特殊类型的矩阵和向量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 2.7 特征分解 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 2.8 奇异值分解 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 2.9 Moore-Penrose 伪逆 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 2.10 迹运算 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 2.11 行列式 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 2.12 实例:主成分分析. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .30 第 3 章 概率与信息论. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .34 3.1 为什么要使用概率 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 3.2 随机变量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 3.3 概率分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 3.3.1 离散型变量和概率质量函数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 3.3.2 连续型变量和概率密度函数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 3.4 边缘概率 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 3.5 条件概率 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 3.6 条件概率的链式法则 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 3.7 独立性和条件独立性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 3.8 期望、方差和协方差 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 3.9 常用概率分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 3.9.1 Bernoulli 分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 3.9.2 Multinoulli 分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 3.9.3 高斯分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 3.9.4 指数分布和 Laplace 分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 3.9.5 Dirac 分布和经验分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 3.9.6 分布的混合 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 3.10 常用函数的有用性质. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .43 3.11 贝叶斯规则 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 3.12 连续型变量的技术细节 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 3.13 信息论 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 3.14 结构化概率模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 第 4 章 数值计算 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 4.1 上溢和下溢 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 4.2 病态条件 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 4.3 基于梯度的优化方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 4.3.1 梯度之上:Jacobian 和 Hessian 矩阵 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 4.4 约束优化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 4.5 实例:线性最小二乘 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 第 5 章 机器学习基础. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .63 5.1 学习算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 5.1.1 任务 T . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 5.1.2 性能度量 P . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 5.1.3 经验 E . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 5.1.4 示例:线性回归 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 5.2 容量、过拟合和欠拟合 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 5.2.1 没有免费午餐定理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 5.2.2 正则化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 5.3 超参数和验证集. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .76 5.3.1 交叉验证 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 5.4 估计、偏差和方差. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .77 5.4.1 点估计 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 5.4.2 偏差 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 5.4.3 方差和标准差 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 5.4.4 权衡偏差和方差以最小化均方误差 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 5.4.5 一致性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 5.5 最大似然估计 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 5.5.1 条件对数似然和均方误差. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .84 5.5.2 最大似然的性质 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 5.6 贝叶斯统计 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 5.6.1 最大后验 (MAP) 估计 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 5.7 监督学习算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 5.7.1 概率监督学习 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 5.7.2 支持向量机 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 5.7.3 其他简单的监督学习算法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .90 5.8 无监督学习算法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .91 5.8.1 主成分分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92 5.8.2 k-均值聚类 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .94 5.9 随机梯度下降 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 5.10 构建机器学习算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 5.11 促使<em>深度学习</em>发展的挑战 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 5.11.1 维数灾难 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 5.11.2 局部不变性和平滑正则化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 5.11.3 流形学习 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 第 2 部分 深度网络:现代实践 第 6 章 深度前馈网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 6.1 实例:学习 XOR. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 6.2 基于梯度的学习 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 6.2.1 代价函数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 6.2.2 输出单元 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 6.3 隐藏单元. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .119 6.3.1 整流线性单元及其扩展 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120 6.3.2 logistic sigmoid 与双曲正切函数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 6.3.3 其他隐藏单元 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122 6.4 架构设计. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .123 6.4.1 万能近似性质和深度. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .123 6.4.2 其他架构上的考虑 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .126 6.5 反向传播和其他的微分算法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .126 6.5.1 计算图 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 6.5.2 微积分中的链式法则. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .128 6.5.3 递归地使用链式法则来实现反向传播 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 6.5.4 全连接 MLP 中的反向传播计算 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131 6.5.5 符号到符号的导数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .131 6.5.6 一般化的反向传播 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .133 6.5.7 实例:用于 MLP 训练的反向传播 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .135 6.5.8 复杂化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137 6.5.9 <em>深度学习</em>界以外的微分 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137 6.5.10 高阶微分 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138 6.6 历史小记. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .139 第 7 章 <em>深度学习</em>中的正则化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141 7.1 参数范数惩罚 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142 7.1.1 L2 参数正则化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142 7.1.2 L1 正则化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144 7.2 作为约束的范数惩罚. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .146 7.3 正则化和欠约束问题. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .147 7.4 数据集增强 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148 7.5 噪声鲁棒性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 7.5.1 向输出目标注入噪声. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .150 7.6 半监督学习 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150 7.7 多任务学习 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150 7.8 提前终止. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .151 7.9 参数绑定和参数共享. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .156 7.9.1 卷积神经网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156 7.10 稀疏表示. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .157 7.11 Bagging 和其他集成方法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .158 7.12 Dropout . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .159 7.13 对抗训练. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .165 7.14 切面距离、正切传播和流形正切分类器 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167 第 8 章 深度模型中的优化. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .169 8.1 学习和纯优化有什么不同 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169 8.1.1 经验风险最小化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169 8.1.2 代理损失函数和提前终止 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170 8.1.3 批量算法和小批量算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170 8.2 神经网络优化中的挑战 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173 8.2.1 病态 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173 8.2.2 局部极小值 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174 8.2.3 高原、鞍点和其他平坦区域 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .175 8.2.4 悬崖和梯度爆炸 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177 8.2.5 长期依赖 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177 8.2.6 非精确梯度 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178 8.2.7 局部和全局结构间的弱对应 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178 8.2.8 优化的理论限制 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179 8.3 基本算法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .180 8.3.1 随机梯度下降 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180 8.3.2 动量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181 8.3.3 Nesterov 动量. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .183 8.4 参数初始化策略 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184 8.5 自适应学习率算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187 8.5.1 AdaGrad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187 8.5.2 RMSProp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188 8.5.3 Adam . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189 8.5.4 选择正确的优化算法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .190 8.6 二阶近似方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190 8.6.1 牛顿法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190 8.6.2 共轭梯度 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191 8.6.3 BFGS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193 8.7 优化策略和元算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194 8.7.1 批标准化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194 8.7.2 坐标下降 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196 8.7.3 Polyak 平均 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197 8.7.4 监督预训练 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197 8.7.5 设计有助于优化的模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199 8.7.6 延拓法和课程学习 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .199 第 9 章 卷积网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201 9.1 卷积运算. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .201 9.2 动机 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203 9.3 池化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207 9.4 卷积与池化作为一种无限强的先验 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 210 9.5 基本卷积函数的变体. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .211 9.6 结构化输出 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218 9.7 数据类型. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .219 9.8 高效的卷积算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 220 9.9 随机或无监督的特征. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .220 9.10 卷积网络的神经科学基础 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221 9.11 卷积网络与<em>深度学习</em>的历史 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226 第 10 章 序列建模:循环和递归网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227 10.1 展开计算图 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 228 10.2 循环神经网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .230 10.2.1 导师驱动过程和输出循环网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232 10.2.2 计算循环神经网络的梯度 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233 10.2.3 作为有向图模型的循环网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 235 10.2.4 基于上下文的 RNN 序列建模 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237 10.3 双向 RNN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239 10.4 基于编码 - 解码的序列到序列架构 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 240 10.5 深度循环网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .242 10.6 递归神经网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .243 10.7 长期依赖的挑战 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 244 10.8 回声状态网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .245 10.9 渗漏单元和其他多时间尺度的策略 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247 10.9.1 时间维度的跳跃连接. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .247 10.9.2 渗漏单元和一系列不同时间尺度 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247 10.9.3 删除连接 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 248 10.10 长短期记忆和其他门控 RNN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 248 10.10.1 LSTM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 248 10.10.2 其他门控 RNN. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .250 10.11 优化长期依赖. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .251 10.11.1 截断梯度 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251 10.11.2 引导信息流的正则化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 252 10.12 外显记忆 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253 第 11 章 实践方法论 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 256 11.1 性能度量. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .256 11.2 默认的基准模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 258 11.3 决定是否收集更多数据 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 259 11.4 选择超参数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 259 11.4.1 手动调整超参数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .259 11.4.2 自动超参数优化算法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .262 11.4.3 网格搜索 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262 11.4.4 随机搜索 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263 11.4.5 基于模型的超参数优化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 264 11.5 调试策略. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .264 11.6 示例:多位数字识别 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 267 第 12 章 应用. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .269 12.1 大规模<em>深度学习</em> . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 269 12.1.1 快速的 CPU 实现 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 269 12.1.2 GPU 实现 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 269 12.1.3 大规模的分布式实现. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .271 12.1.4 模型压缩 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271 12.1.5 动态结构 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 272 12.1.6 深度网络的专用硬件实现 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 273 12.2 计算机视觉 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 274 12.2.1 预处理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 275 12.2.2 数据集增强 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 277 12.3 语音识别. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .278 12.4 自然语言处理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .279 12.4.1 n-gram . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .280 12.4.2 神经语言模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 281 12.4.3 高维输出 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 282 12.4.4 结合 n-gram 和神经语言模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 286 12.4.5 神经机器翻译 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287 12.4.6 历史展望 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289 12.5 其他应用. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .290 12.5.1 推荐系统 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 290 12.5.2 知识表示、推理和回答 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 292 第 3 部分 <em>深度学习</em>研究 第 13 章 线性因子模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 297 13.1 概率 PCA 和因子分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 297 13.2 独立成分分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .298 13.3 慢特征分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 300 13.4 稀疏编码. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .301 13.5 PCA 的流形解释 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 304 第 14 章 自编码器 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 306 14.1 欠完备自编码器 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 306 14.2 正则自编码器 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .307 14.2.1 稀疏自编码器 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 307 14.2.2 去噪自编码器 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 309 14.2.3 惩罚导数作为正则. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .309 14.3 表示能力、层的大小和深度 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 310 14.4 随机编码器和解码器. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .310 14.5 去噪自编码器详解 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 311 14.5.1 得分估计 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 312 14.5.2 历史展望 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 314 14.6 使用自编码器学习流形 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 314 14.7 收缩自编码器 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .317 14.8 预测稀疏分解 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .319 14.9 自编码器的应用 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 319 第 15 章 表示学习 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 321 15.1 贪心逐层无监督预训练 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 322 15.1.1 何时以及为何无监督预训练有效有效 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323 15.2 迁移学习和领域自适应 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 326 15.3 半监督解释因果关系. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .329 15.4 分布式表示 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 332 15.5 得益于深度的指数增益 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 336 15.6 提供发现潜在原因的线索 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 337 第 16 章 <em>深度学习</em>中的结构化概率模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 339 16.1 非结构化建模的挑战. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .339 16.2 使用图描述模型结构. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .342 16.2.1 有向模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 342 16.2.2 无向模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 344 16.2.3 配分函数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 345 16.2.4 基于能量的模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .346 16.2.5 分离和 d-分离 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .347 16.2.6 在有向模型和无向模型中转换 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 350 16.2.7 因子图 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 352 16.3 从图模型中采样 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 353 16.4 结构化建模的优势 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 353 16.5 学习依赖关系 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .354 16.6 推断和近似推断 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 354 16.7 结构化概率模型的<em>深度学习</em>方法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .355 16.7.1 实例:受限玻尔兹曼机 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 356 第 17 章 蒙特卡罗方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 359 17.1 采样和蒙特卡罗方法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .359 17.1.1 为什么需要采样 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .359 17.1.2 蒙特卡罗采样的基础. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .359 17.2 重要采样. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .360 17.3 马尔可夫链蒙特卡罗方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 362 17.4 Gibbs 采样. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .365 17.5 不同的峰值之间的混合挑战 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 365 17.5.1 不同峰值之间通过回火来混合 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 367 17.5.2 深度也许会有助于混合 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 368 第 18 章 直面配分函数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 369 18.1 对数似然梯度 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .369 18.2 随机最大似然和对比散度 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 370 18.3 伪似然 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 375 18.4 得分匹配和比率匹配. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .376 18.5 去噪得分匹配 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .378 18.6 噪声对比估计 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .378 18.7 估计配分函数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .380 18.7.1 退火重要采样 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 382 18.7.2 桥式采样 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 384 第 19 章 近似推断 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 385 19.1 把推断视作优化问题. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .385 19.2 期望最大化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 386 19.3 最大后验推断和稀疏编码 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 387 19.4 变分推断和变分学习. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .389 19.4.1 离散型潜变量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 390 19.4.2 变分法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 394 19.4.3 连续型潜变量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 396 19.4.4 学习和推断之间的相互作用 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 397 19.5 学成近似推断 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .397 19.5.1 醒眠算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 398 19.5.2 学成推断的其他形式. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .398 第 20 章 深度生成模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 399 20.1 玻尔兹曼机 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 399 20.2 受限玻尔兹曼机 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 400 20.2.1 条件分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 401 20.2.2 训练受限玻尔兹曼机. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .402 20.3 深度信念网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .402 20.4 深度玻尔兹曼机 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 404 20.4.1 有趣的性质 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 406 20.4.2 DBM 均匀场推断 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 406 20.4.3 DBM 的参数学习 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 408 20.4.4 逐层预训练 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 408 20.4.5 联合训练深度玻尔兹曼机 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 410 20.5 实值数据上的玻尔兹曼机 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 413 20.5.1 Gaussian-Bernoulli RBM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 413 20.5.2 条件协方差的无向模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 414 20.6 卷积玻尔兹曼机 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 417 20.7 用于结构化或序列输出的玻尔兹曼机 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 418 20.8 其他玻尔兹曼机 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 419 20.9 通过随机操作的反向传播 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 419 20.9.1 通过离散随机操作的反向传播 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 420 20.10 有向生成网络. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .422 20.10.1 sigmoid 信念网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 422 20.10.2 可微生成器网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .423 20.10.3 变分自编码器 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .425 20.10.4 生成式对抗网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .427 20.10.5 生成矩匹配网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .429 20.10.6 卷积生成网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .430 20.10.7 自回归网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 430 20.10.8 线性自回归网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .430 20.10.9 神经自回归网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .431 20.10.10 NADE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 432 20.11 从自编码器采样 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 433 20.11.1 与任意去噪自编码器相关的马尔可夫链 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 434 20.11.2 夹合与条件采样 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .434 20.11.3 回退训练过程 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .435 20.12 生成随机网络. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .435 20.12.1 判别性 GSN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 436 20.13 其他生成方案. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .436 20.14 评估生成模型. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .437 20.15 结论 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 438 参考文献. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .439 索引 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 486
深度学习Deep Learning with Python 2017》高清完整PDF版
<em>深度学习</em>Deep Learning with Python 2017_w.pdf
Neural Network and Deep Learning神经网络与深度学习 中文高清完整版PDF
深入浅出的有关神经网络和<em>深度学习</em>教程,译自 Michael Nielsen 的[电子书] 本人已阅读完毕,其中一部分翻译和主流翻译有出入,但整体框架把握的很棒,并且讲出了<em>深度学习</em>中选择特定处理措施的原因,此外还有着对过去的总结和未来的展望。是一本非常不错的入门综述书籍。 神经网络和<em>深度学习</em>是一本在线书。本书会教会你: 神经网络,一种美妙的受生物学启发的编程范式,可以让计算机从观测数据中进行学习 <em>深度学习</em>,一个强有力的用于神经网络学习的众多技术的集合 神经网络和<em>深度学习</em>目前给出了在图像识别、语音识别和自然语言处理领域中很多问题的最好解决方案。本书将会教你在神经网络和<em>深度学习</em>背后的众多核心概念。 本人已阅读完毕,其中一部分翻译和主流翻译有出入,但整体框架把握的很棒,并且讲出了<em>深度学习</em>中选择特定处理措施的原因,此外还有着对过去的总结和未来的展望。是一本非常不错的入门综述书籍。
deep learning 完整中文版(无水印)
<em>deep</em> <em>learning</em> 完整<em>中文版</em>(无水印)一种20章,738页
Neural Network and Deep Learning神经网络与深度学习中文高清完整版PDF
Neural Network and Deep Learning 神经网络与<em>深度学习</em><em>中文版</em>
深度学习 AI圣经 deep learning 中文文字版 带书签 完整版(700多页)
AI圣经!<em>深度学习</em>领域奠基性的经典畅销书!长期位居美国亚马逊AI和机器学习类图书榜首!所有数据科学家和机器学习从业者的必读图书!特斯拉CEO埃隆·马斯克等国内外众多专家推荐! <em>深度学习</em>是机器学习的一个分支,它能够使计算机通过层次概念来学习经验和理解世界。因为计算机能够从经验中获取知识,所以不需要人类来形式化地定义计算机需要的所有知识。层次概念允许计算机通过构造简单的概念来学习复杂的概念,而这些分层的图结构将具有很深的层次。本书会介绍<em>深度学习</em>领域的许多主题。 本书囊括了数学及相关概念的背景知识,包括线性代数、概率论、信息论、数值优化以及机器学习中的相关内容。同时,它还介绍了工业界中实践者用到的<em>深度学习</em>技术,包括深度前馈网络、正则化、优化算法、卷积网络、序列建模和实践方法等,并且调研了诸如自然语言处理、语音识别、计算机视觉、在线推荐系统、生物信息学以及视频游戏方面的应用。*后,本书还提供了一些研究方向,涵盖的理论主题包括线性因子模型、自编码器、表示学习、结构化概率模型、蒙特卡罗方法、配分函数、近似推断以及深度生成模型。 《<em>深度学习</em>》这本书既可以被本科生或研究生用于规划其学术界或工业界生涯,也适用于希望在各种产品或平台上开始使用<em>深度学习</em>技术的软件工程师。作者 在本书的配套网站上为读者和教师提供了补充资料。<em>中文版</em>读者可以访问人民邮电出版社异步社区www.epubit.com.cn获取相关信息。
Deep Learning 经典书籍中文版
Deep Learning 经典书籍 <em>中文版</em> 高清pdf 有书签 很好书籍
深度学习》(deep learning)PDF扫描版-2017年8月出版
《<em>深度学习</em>》(<em>deep</em> <em>learning</em>)PDF扫描版-2017年8月出版
Grokking Deep Learning 正式版pdf
Grokking Deep Learning teaches you to build <em>deep</em> <em>learning</em> neural networks from scratch! In his engaging style, seasoned <em>deep</em> <em>learning</em> expert Andrew Trask shows you the science under the hood, so you grok for yourself every detail of training neural networks. Using only Python and its math-supporting library, NumPy, you’ll train your own neural networks to see and understand images, translate text into different languages, and even write like Shakespeare! When you’re done, you’ll be fully prepared to move on to mastering <em>deep</em> <em>learning</em> frameworks
深度学习-deep learning-AI圣经(高清中文带书签版)PDF下载
“本书名为《<em>深度学习</em>》被称为AI圣经,是一本不可多得的<em>深度学习</em>书籍,是由<em>深度学习</em>领域大牛所写,写作初衷是为了写一本<em>深度学习</em>经典指导书籍。 n本书是全本内容,为中文高清版,带有书签查阅非常方便。 n相信会给你带来不一样的阅读感受。 n链接:https://pan.baidu.com/s/1oeIFu5UpqI–ZQpcd7JTVg n密码:jt9u n“...
AI圣经,deeplearning(百度云自行下载,免费)
各位大佬,链接在下方,求一本《<em>深度学习</em>、优化与识别》的pdf,链接:https://pan.baidu.com/s/1Ao9p7P3gRYhvMYatpZxRjA 密码:99ae
深度学习-deep learning-AI圣经(高清带书签版)
本书名为《<em>深度学习</em>》被称为AI圣经,是一本不可多得的<em>深度学习</em>书籍,是由<em>深度学习</em>领域大牛所写,写作初衷是为了写一本<em>深度学习</em>经典指导书籍。 本书是全本内容,为中文高清版,带有书签查阅非常方便。 相信会给你带来不一样的阅读感受。
深度学习-中文版.mobi
《<em>深度学习</em>》由全球知名的三位专家Ian Goodfellow、Yoshua Bengio 和Aaron Courville撰写,是<em>深度学习</em>领域奠基性的经典教材。全书的内容包括3个部分:第1部分介绍基本的数学工具和机器学习的概念,它们是<em>深度学习</em>的预备知识;第2部分系统深入地讲解现今已成熟的<em>深度学习</em>方法和技术;第3部分讨论某些具有前瞻性的方向和想法,它们被公认为是<em>深度学习</em>未来的研究重点。 《<em>深度学习</em>》适合各类读者阅读,包括相关专业的大学生或研究生,以及不具有机器学习或统计背景、但是想要快速补充<em>深度学习</em>知识,以便在实际产品或平台中应用的软件工程师。
《Deep Learning》全书已完稿_附全书电子版
Bengio大神的《Deep Learning》全书。经过两年半的努力,由谷歌大脑团队科学家 Ian Goodfellow, Yoshua Bengio and Aaron Courville撰写MIT出版的《Deep Learning》,今天完成最终稿了。提供整本书的<em>下载</em>链接。
deep learning中文版(花书)
<em>deep</em> <em>learning</em><em>中文版</em>(花书)v0.5,最新版,感谢大神们
Deep Learning With Python_中文版+英文版+代码+数据集
Deep Learning With Python_<em>中文版</em>+英文版+代码+数据集 本书由Keras之父、现任Google人工智能研究员的François Chollet执笔,详尽展示了用Python、Keras、TensorFlow进行<em>深度学习</em>的探索实践,涉及计算机视觉、自然语言处理、生成式模型等应用。在学习完本书后,读者将了解<em>深度学习</em>、机器学习和神经网络的关键概念,具备搭建自己的<em>深度学习</em>环境、建立图像识别模型、生成图像和文字等能力,学会解决现实世界中的<em>深度学习</em>问题。除此之外,本书还深刻剖析了当前的“人工智能热”,从理性的视角展望了<em>深度学习</em>在未来的可能性。
Python深度学习(Deep Learning With Python中文版-英文版)
本书由Keras之父、现任Google人工智能研究员的弗朗索瓦•肖莱(François Chollet)执笔,详尽介绍了用Python和Keras进行<em>深度学习</em>的探索实践,包括计算机视觉、自然语言处理、产生式模型等应用。书中包含30多个代码示例,步骤讲解详细透彻。由于本书立足于人工智能的可达性和大众化,读者无须具备机器学习相关背景知识即可展开阅读。 人工智能机器学习经典教程,用Python Keras TensorFlow进行<em>深度学习</em>的探索实践 Keras之父, 谷歌人工智能研究员执笔,<em>深度学习</em>领域力作.
泛读论文:deep Learning 深度学习合集
Deep LearningnnVery Deep Convolutional Networks for Large-Scale Image RecognitionnnICLR 2015nn问题nnn网络模型不够深nnn方法**nnn用3个 3x3的核 替换 1个 7x7的核 n更多的非线性映射 3 vs. 1n更少的参数 3∗(32C2)3∗(32C2)3*(3^2C^2) vs. 72C272...
deep learning-李宏毅(中文版)
<em>deep</em> <em>learning</em> - 李宏毅 一书的<em>中文版</em>本,google翻译版本
Ian Goodfellow等人的深度学习 Deep Learning 中文版(PDF)
Ian Goodfellow等人的Deep Learning <em>中文版</em>(PDF),我还上传了一份英文版,可以搜索<em>下载</em>
深度学习 中文版 【Mobi格式】
《<em>深度学习</em>》由全球知名的三位专家Ian Goodfellow、Yoshua Bengio 和Aaron Courville撰写,是<em>深度学习</em>领域奠基性的经典教材。全书的内容包括3个部分:第1部分介绍基本的数学工具和机器学习的概念,它们是<em>深度学习</em>的预备知识;第2部分系统深入地讲解现今已成熟的<em>深度学习</em>方法和技术;第3部分讨论某些具有前瞻性的方向和想法,它们被公认为是<em>深度学习</em>未来的研究重点。 《<em>深度学习</em>》适合各类读者阅读,包括相关专业的大学生或研究生,以及不具有机器学习或统计背景、但是想要快速补充<em>深度学习</em>知识,以便在实际产品或平台中应用的软件工程师。
神经网络与深度学习(Neural Networks and Deep Learning)高清文字最新中文版 Michael Nielsen
本书为Michael Nielsen教授所写,主要对神经网络和<em>深度学习</em>进行了介绍,内含中文翻译最新版2018.04.04,是本站里面的 最新最新最新 翻译版。标准规范的文字排版,带书签目录。以及对应的 源代码。值得5分<em>下载</em>。Enjoy!
深度学习(Deep Learning)入门——基本概念
n Author: LiChong0309 n Label: Artificial Intelligence 、Machine Learning 、Deep Learning nnnnn1.神经网络(Neural Network)基础n1.1 神经元(neuron)n1.2 权重(weights)n1.3 偏差(bias)n1.4 激活函数(Activation function)nnn2 ...
深度学习界圣经“花书”Deep Learning公开中文版免费下载
原作者将书在网上公开了的,志愿者翻译成中文。下面的GitHub主页。nnhttps://github.com/exacity/<em>deep</em><em>learning</em>book-chinese/releasesnnGithub<em>下载</em>东西太慢了,这里分享我<em>下载</em>后上传的百度网盘链接(文件大小30M左右)。提取码: rctg 。nn个人评价:本人买了本纸质书,定价十分感人:169RMB。阅读本书需要极有耐心,并且需要大学的...
Python深度学习+Deep Learning With Python. 无损高清版
本书由 Keras 之父、现任 Google 人工智能研究员的弗朗索瓦 • 肖莱(François Chollet)执笔,详尽介 绍了用 Python 和 Keras 进行<em>深度学习</em>的探索实践,涉及计算机视觉、自然语言处理、生成式模型等应用。
Grokking Deep Learning - 最新版-无水印-有目录-非扫描版
一本绝佳的<em>深度学习</em>入门书!CSDN不能免费所以就要一个币了,物超所值!书名直译,就叫《与<em>深度学习</em>神交》吧。虽是新书,但作者并非无名之辈,而且不论是GitHub,还是Twitter,都纷纷点赞这本新教材。更重要的是,这还是一本入门教材。作者说,这本书写了近3年,边写边接受反馈,同时还有配套的手把手实操指南。作者自序:只要有高中数学基础、有点编程经验——比如Python和numpy,你就可以开始学习进阶了。之所以这么做,一是希望任何感兴趣<em>深度学习</em>的人,都能通过这本书认识<em>深度学习</em>,不会被枯燥的高等数学和复杂代码吓倒。另一方面也是希望真正想从事AI的人,哪怕只有高中数学基础,或者懂一点编程,都能从第一章开始,不断升级进阶,最后掌握<em>深度学习</em>的原理、应用和实操。总之,希望<em>深度学习</em>、AI,都能成为人人可用的工具。
Deep Learning with Python(英文)(视频+源文件+代码)
<em>深度学习</em>英文教程:视频+源文件+代码,附有源码可以自己在电脑上运行,挺不错的。
Deep Learning with Keras. PDF高清版
Deep Learning with Keras. PDF高清版,带书签
深度学习图解-Grokking Deep Learning-Andrew Trask-PDF和完整代码
<em>深度学习</em>图解-Grokking Deep Learning-PDF和完整代码。《Grokking Deep Learning》是开始<em>深度学习</em>之旅的理想书籍。与其学习某些库或框架的“黑匣子”API,不如从头了解如何构建这些算法。您将了解<em>深度学习</em>如何能够在比人类更高的水平上学习。您将能够理解最先进的人工智能背后的“大脑”。此外,不像其他书籍需要微积分的高级知识并利用复杂的数学符号,而本书只需要你了解高中代数和基本的Python基础知识。
Grokking Deep Learning 2019版
非常好的<em>深度学习</em>入门资料,作者不用数学公式,用图解的方式来解读<em>深度学习</em>,适合快速入门用。
Deep Learning-Ian Goodfellow (2017)带书签、高清可复制PDF
Deep Learning-Ian Goodfellow, Yoshua Bengio, Aaron Courville(2017)带书签、高清可复制PDF。<em>深度学习</em>教父级书籍。 本书被组织为三个部分:第一部分介绍了基本的数学工具和机器学习的概念;第二部分介绍了本质上已解决的技术、最成熟的<em>深度学习</em>算法;第三部分介绍了被广泛认为是<em>深度学习</em>未来研究重点的但更具猜测性的想法。
Neural Network and Deep Learning(神经网络和深度学习)--中英文版
《Neural Network and Deep Learning》,中文译为《神经网络与<em>深度学习</em>》。这是一本解释人工神经网络和<em>深度学习</em>背后核心思想的免费在线书籍
Deep Learning(中文版)(An MIT Press Book)
Deep Learning(<em>中文版</em>)(An MIT Press Book)
Deep Learning (Ian GoodFellow 等著) 完整高清版
MIT Deep Learning 大师 Ian GoodFellow 等著的 Deep Learing 书籍。
deep learning (中文版)Lan Goodfellow Yoshua Bengio
对于那些刚接触<em>深度学习</em>,而不知道学习什么的人来说,这本书会给出一个清晰的学习计划和详细的内容。本文由Lan Goodfellow,Yoshua Bengio,Aaron Courville合作完成,其中Lan被誉为“GAN之父”,Yoshua Bengio也是<em>深度学习</em>研究领域的专家。
Ian Goodfellow,Yoshua Bengio合著《深度学习》教材,2017年最新中文版下载
Ian Goodfellow,Yoshua Bengio合著《<em>深度学习</em>》教材,2017年最新<em>中文版</em><em>下载</em>。rn链接:https://pan.baidu.com/s/1gf7o7ezrn密码:扫描下方二维码,回复关键字“new”即可。还有更多关于深度强化学习,斯坦福2017年最新Tensorflow视频教程,生成对抗网络GAN视频教程。
《图解深度学习》Grokking-Deep-Learning V10
《Grokking-Deep-Learning》图解<em>深度学习</em>PDF电子书和随书代码
MATLAB Deep Learning [PDF,2017]
Phil Kim, "MATLAB Deep Learning: With Machine Learning, Neural Networks and Artificial Intelligence" English | ISBN: 1484228448 | 2017 | 151 pages | PDF | 4 MB Get started with MATLAB for <em>deep</em> <em>learning</em> and AI with this in-depth primer. In this book, you start with machine <em>learning</em> fundamentals, then move on to neural networks, <em>deep</em> <em>learning</em>, and then convolutional neural networks. In a blend of fundamentals and applications, MATLAB Deep Learning employs MATLAB as the underlying programming language and tool for the examples and case studies in this book. With this book, you'll be able to tackle some of today's real world big data, smart bots, and other complex data problems. You’ll see how <em>deep</em> <em>learning</em> is a complex and more intelligent aspect of machine <em>learning</em> for modern smart data analysis and usage. What You'll Learn Use MATLAB for <em>deep</em> <em>learning</em> Discover neural networks and multi-layer neural networks Work with convolution and pooling layers Build a MNIST example with these layers Who This Book Is For Those who want to learn <em>deep</em> <em>learning</em> using MATLAB. Some MATLAB experience may be useful.
Yoshua Bengio新书《Deep Learning》深度学习(中文)学习笔记(improving)
<em>深度学习</em>(中文)学习笔记:
深度学习Deep Learning 中文版 2017.3.15
<em>深度学习</em>Deep Learning <em>中文版</em> <em>深度学习</em>Deep Learning <em>中文版</em><em>深度学习</em>Deep Learning <em>中文版</em>
Deep Learning from Scratch(中文名:深度学习入门:于python的理论与实践)
斋藤康毅 的 《Deep Learning from Scratch》,中文名《<em>深度学习</em>入门:于python的理论与实践》
Deep Learning with Python 原版PDF by Chollet
This book was written for anyone who wishes to explore <em>deep</em> <em>learning</em> from scratch or broaden their understanding of <em>deep</em> <em>learning</em>. Whether you’re a practicing machine-<em>learning</em> engineer, a software developer, or a college student, you’ll find value in these pages. This book offers a practical, hands-on exploration of <em>deep</em> <em>learning</em>. It avoids mathematical notation, preferring instead to explain quantitative concepts via code snippets and to build practical intuition about the core ideas of machine <em>learning</em> and <em>deep</em> <em>learning</em>.
《2017_MATLAB_DeepLearning》完整版-Phil Kim著作
MATLAB Deep Learning 2017最新完整版Phil Kim博士著作,with machine <em>learning</em>,neural networks and Artificial intelligence
Deep Learning With Python_中文版+英文版+代码
Deep Learning With Python_<em>中文版</em>+英文版+代码 --本书由Keras之父、现任Google人工智能研究员的弗朗索瓦•肖莱(François Chollet)执笔,详尽介绍了用Python和Keras进行<em>深度学习</em>的探索实践,包括计算机视觉、自然语言处理、产生式模型等应用。书中包含30多个代码示例,步骤讲解详细透彻。由于本书立足于人工智能的可达性和大众化,读者无须具备机器学习相关背景知识即可展开阅读。在学习完本书后,读者将具备搭建自己的<em>深度学习</em>环境、建立图像识别模型、生成图像和文字等能力。
DeepLearning(深度学习中文版)AI圣经
《Deep Learning》<em>中文版</em>(印前版)正式发布。这本书适合于各类读者,尤其是学习机器学习的本科或研究生、<em>深度学习</em>和人工智能的研究者、或没有机器学习与统计背景的软件工程师。 《Deep Learning》这本书是由学界领军人物 Ian Goodfellow、Yoshua Bengio 和 Aaron Courville 合力打造,特斯拉的 CEO 马斯克曾经评价道:《Deep Learning》由领域内三位专家合著,是该领域内唯一的综合性书籍。 这本书的主题具体来说,是机器学习的一种,一种能够使计算 机系统从经验和数据中得到提高的技术。<em>深度学习</em>是一种特定类型的机器学习,具有强大的能力和灵活性,它将大千世界表示为嵌套的层次概念体系(由较简单概念间的联系定义复杂概念、从一般抽象概括到高级抽象表示)。对于本书的结构,第一部分介绍基本的数学工具和机器学习的概念,第二部分介绍最成熟的<em>深度学习</em>算法,而第三部分讨论某些具有展望性的想法,它们被广泛地认为是<em>深度学习</em>未来的研究重点。 因此,本书从基础数学知识到各类深度方法全面而又深入地描述了深度 学习的各个主题。译者们也相信开源此书 PDF 版的中文译文可以促进大家对<em>深度学习</em>的基 础和前沿知识有进一步的理解,也相信通过开放高质量的专业书籍能做到先阅读后付费。
deep_learning_with_python.pdf(Jason Brownlee)+Deep Learning with Python 2017.pdf
<em>深度学习</em>书籍包括<em>deep</em>_<em>learning</em>_with_python.pdf(Jason Brownlee)、<em>深度学习</em>Deep Learning with Python 2017.pdf。
AI深度学习圣经 deep learning全英文版 无水印带书签 完整版
这本书对各类读者都有一定用处,但我们主要是为两类受众对象而写的。其中 一类受众对象是学习机器学习的大学生(本科或研究生),包括那些已经开始职业 生涯的<em>深度学习</em>和人工智能研究者。另一类受众对象是没有机器学习或统计背景但 希望能快速地掌握这方面知识并在他们的产品或平台中使用<em>深度学习</em>的软件工程师。 <em>深度学习</em>在许多软件领域都已被证明是有用的,包括计算机视觉、语音和音频处理、 自然语言处理、机器人技术、生物信息学和化学、电子游戏、搜索引擎、网络广告和 金融 英文原版更能使读者深入了解文章原意,更好的学习<em>深度学习</em>。
最新高清版 自然语言处理 NLP 深度学习《Deep Learning in Natural Language Processing》
最新高清版 自然语言处理 NLP <em>深度学习</em> 人工智能的好素材 CNN LSTM 实体识别 切词 权重 主题提取 篇章理解 知识图谱 《Deep Learning in Natural Language Processing》 <em>下载</em>后解压即可,zip压缩包
Fundamentals of Deep Learning 深度学习基础(东南大学出版社) pdf
Fundamentals of Deep Learning_ Designing Next-Generation Machine Intelligence Algorithms.pdf
Deep Learning.深度学习中文翻译版
Deep Learning中文翻译的开源版本,这个是最新的v0.5<em>中文版</em>。
deep learning_Ian Goodfellow (英文原著+中文翻译版)
原书地址 http://www.<em>deep</em><em>learning</em>book.org/ , <em>中文版</em>地址 https://github.com/exacity/<em>deep</em><em>learning</em>book-chinese 。 分享给大家,希望我们一起进步。
深度学习DeepLearning(带目录中文版
<em>深度学习</em>圣经,包含所有<em>深度学习</em>方面知识,内容较多,适合有一定基础的同学研读。
深度学习(epub版)2017年8月1日出版
出版社: 人民邮电出版社 版次:1 外文名称:<em>deep</em> <em>learning</em> AI圣经!<em>深度学习</em>领域奠基性的经典畅销书!长期位居美国ya马逊AI和机器学习类图书榜首!所有数据科学家和机器学习从业者的bi读图书!特斯拉CEO埃隆·马斯克等国内外众多专家推jian!   <em>深度学习</em>是机器学习的一个分支,它能够使计算机通过层次概念来学习经验和理解世界。因为计算机能够从经验中获取知识,所以不需要人类来形式化地定义计算机需要的所有知识。层次概念允许计算机通过构造简单的概念来学习复杂的概念,而这些分层的图结构将具有很深的层次。本书会介绍<em>深度学习</em>领域的许多主题。   本书囊括了数学及相关概念的背景知识,包括线性代数、概率论、信息论、数值优化以及机器学习中的相关内容。同时,它还介绍了工业界中实践者用到的<em>深度学习</em>技术,包括深度前馈网络、正则化、优化算法、卷积网络、序列建模和实践方法等,并且调研了诸如自然语言处理、语音识别、计算机视觉、在线推荐系统、生物信息学以及视频游戏方面的应用。最后,本书还提供了一些研究方向,涵盖的理论主题包括线性因子模型、自编码器、表示学习、结构化概率模型、蒙特卡罗方法、配分函数、近似推断以及深度生成模型。
Neural Networks and Deep Learning-神经网络与深度学习
Michael Nielsen所著的Neural Networks and Deep Learning,非常适合用来入门神经网络和<em>深度学习</em>。原书为网页版书籍。这里提供PDF版本书籍。PDF版本制作者:欧拉。欧拉的博客:www.liuhao.me
深度学习 Deep Learning Ian Goodfellow 赵申剑等 pdf
<em>深度学习</em> pdf 文字版,带书签整合版,文件太大,压缩了一下。 作者: 【美】Ian Goodfellow(伊恩·古德费洛) , 【加】Yoshua Bengio(约书亚·本吉奥) , 【加】Aaron Courville(亚伦·库维尔) 译者: 赵申剑 , 黎彧君 , 李凯 , 符天凡
《Deep learning深度学习》英文原版PDF格式
作者: Ian Goodfellow Yoshua Bengio Aaron Courville 完整整合版,内容清晰,内附目录书签,方便浏览
深度学习中文版)(Ian Goodfellow, Yoshua Bengio, Aaron Courville)
<em>深度学习</em>领域的三位大牛撰写的,是<em>中文版</em>,带完整书签。
Phil Kim-2017Matlab_DeepLearning电子书
Phil Kim-2017Matlab_DeepLearning 电子书和配套代码,非常适合初学者
Ian Goodfellow等人的Deep Learning 英文版(含PDF、mobi和epub)
Ian Goodfellow等人的Deep Learning 英文版(含PDF、mobi和epub),我还上传了一份<em>中文版</em>,可以搜索<em>下载</em>
deeplearningbook中文版来了,屌炸天!
这本书的<em>中文版</em>来袭,太赞了!rnhttp://www.<em>deep</em><em>learning</em>book.org/rnrnrn<em>下载</em>在这里,在这里!rnrnrn太毕了!
【2018 最新】deep learning 深度学习的现状及局限综述
【2018 最新】<em>deep</em> <em>learning</em> 纽约大学教授Gary Marcus长文对<em>深度学习</em>的现状及局限性批判性探讨 + Deep Learning-LeCun、Bengio和Hinton三大牛的综述[2015]。讲解讨论了<em>深度学习</em>是什么?<em>深度学习</em>能做好什么? <em>深度学习</em>的局限性、过度炒作的潜在风险、更好的人工智能方法是什么?等非常核心的问题,对机器学习、<em>深度学习</em>研究者和学习者启发很大!
深度学习中文版)(麻省理工出版)
作者简介 · · · · · · Ian Goodfellow is Research Scientist at OpenAI. Yoshua Bengio is Professor of Computer Science at the Université de Montréal. Aaron Courville is Assistant Professor of Computer Science at the Université de Montréal.
深度学习中文版,高清非扫描可复制PDF)-IanGoodfellow(伊恩·古德费洛) 著
<em>深度学习</em>(<em>中文版</em>,高清非扫描可复制PDF)-IanGoodfellow(伊恩·古德费洛) 著 <em>深度学习</em>(<em>中文版</em>,高清非扫描可复制PDF)-IanGoodfellow(伊恩·古德费洛) 著 <em>深度学习</em>(<em>中文版</em>,高清非扫描可复制PDF)-IanGoodfellow(伊恩·古德费洛) 著
Deep Learning Book (深度学习)中文版 pdf 带书签
  《<em>深度学习</em>》由全球知名的三位专家IanGoodfellow、YoshuaBengio和AaronCourville撰写,是<em>深度学习</em>领域奠基性的经典教材。全书的内容包括3个部分:第1部分介绍基本的数学工具和机器学习的概念,它们是<em>深度学习</em>的预备知识;第2部分系统深入地讲解现今已成熟的<em>深度学习</em>方法和技术;第3部分讨论某些具有前瞻性的方向和想法,它们被公认为是<em>深度学习</em>未来的研究重点。   《<em>深度学习</em>》适合各类读者阅读,包括相关专业的大学生或研究生,以及不具有机器学习或统计背景、但是想要快速补充<em>深度学习</em>知识,以便在实际产品或平台中应用的软件工程师。 购买地址:https://item.jd.com/12128543.html
深度学习中文版-Deep Learning-Yoshua Bengio.pdf 图解机器学习.pdf
图解机器学习.pdf <em>深度学习</em><em>中文版</em>-Deep Learning-Yoshua Bengio.pdf
Bengio写的MIT Press《Deep learning》PDF整理版
<em>深度学习</em>,MIT,<em>deep</em> <em>learning</em>, Yoshua Bengio,Ian Goodfellow,Aaron Courville
ai圣经 深度 学习 高清 - Ai圣经高清中文版 深度学习 完整pdf
Ai圣经高清<em>中文版</em> <em>深度学习</em> Ai圣经高清<em>中文版</em> <em>深度学习</em> Ai圣经高清<em>中文版</em> <em>深度学习</em>
吴恩达深度学习专项课程编程作业集合 LaTex版 304页 Deep Learning Specialization (5 courses)
吴恩达<em>深度学习</em>专项课程编程作业集合 LaTex版 共计304页 Deep Learning Specialization (5 courses) 此文档整理了 Neural Networks and Deep Learning、Improving Deep Neural Networks、Structuring Machine Learning Projects、Convolutional Neural Networks 4门<em>深度学习</em>专项课程编程作业,采用LaTex排版,包括所有基础知识及作业代码,值得<em>下载</em>离线学习!
花书deepLearning中文版pdf
花书<em>deep</em>Learning<em>中文版</em>pdf,纯中文,为方便<em>深度学习</em>而上传
Deep Learning with Python - Keras作者Francois Chollet新作
Early Release 完整版 Deep <em>learning</em> is applicable to a widening range of artificial intelligence problems, such as image classification, speech recognition, text classification, question answering, text-to-speech, and optical character recognition. Deep Learning with Python is structured around a series of practical code examples that illustrate each new concept introduced and demonstrate best practices. By the time you reach the end of this book, you will have become a Keras expert and will be able to apply <em>deep</em> <em>learning</em> in your own projects.
吴恩达-深度学习-Deeplearning-课程中文版笔记
Coursera<em>深度学习</em>教程中文笔记 课程概述 这些课程专为已有一定基础(基本的编程知识,熟悉Python、对机器学习有基本了解),想要尝试进入人工智能领域的计算机专业人士准备。介绍显示:“<em>深度学习</em>是科技业最热门的技能之一,本课程将帮你掌握<em>深度学习</em>。” 在这5堂课中,学生将可以学习到<em>深度学习</em>的基础,学会构建神经网络,并用在包括吴恩达本人在内的多位业界顶尖专家指导下创建自己的机器学习项目。Deep Learning Specialization对卷积神经网络 (CNN)、递归神经网络 (RNN)、长短期记忆 (LSTM) 等<em>深度学习</em>常用的网络结构、工具和知识都有涉及。 课程中也会有很多实操项目,帮助学生更好地应用自己学到的<em>深度学习</em>技术,解决真实世界问题。这些项目将涵盖医疗、自动驾驶、和自然语言处理等时髦领域,以及音乐生成等等。Coursera上有一些特定方向和知识的资料,但一直没有比较全面、深入浅出的<em>深度学习</em>课程——《<em>深度学习</em>专业》的推出补上了这一空缺。 课程的语言是Python,使用的框架是Google开源的TensorFlow。最吸引人之处在于,课程导师就是吴恩达本人,两名助教均来自斯坦福计算机系。完成课程所需时间根据不同的学习进度,大约需要3-4个月左右。学生结课后,Coursera将授予他们Deep Learning Specialization结业证书。 “我们将帮助你掌握<em>深度学习</em>,理解如何应用<em>深度学习</em>,在人工智能业界开启你的职业生涯。”吴恩达在课程页面中提到。
Deep Learning - MIT Press: 深度学习 英文.pdf版/mobi/epub电子书
个人认为<em>深度学习</em>之最强教材。近年来<em>深度学习</em>研究者公认课题一网打尽。不仅内容广泛,每个课题的理论背景,公式,实现注意事项等细节都有详细描述。如果要系统掌握<em>深度学习</em>专家们已经确立的方法,这是一本绝好的教科书。 Zip中epub, mobi, pdf有三种格式,kindle, iPad等多种设备上都可以看。
tomcat5.0下载
tomcat下载,完整无毒,多谢 参与!! 相关下载链接:[url=//download.csdn.net/download/cc515404480/3300742?utm_source=bbsseo]//download.csdn.net/download/cc515404480/3300742?utm_source=bbsseo[/url]
大型系统的JAva中间件实践-曾宪杰,淘宝下载
InfoQ大会上淘宝的Java中间件ppt.非常有用的资料。对于理解分布式系统的架构非常有用。 相关下载链接:[url=//download.csdn.net/download/cherrycheek/5046492?utm_source=bbsseo]//download.csdn.net/download/cherrycheek/5046492?utm_source=bbsseo[/url]
DSP CCS电子书籍下载
DSP5000系列编程软件学习资料,对初学者有用。。 相关下载链接:[url=//download.csdn.net/download/gongjunhui/2774793?utm_source=bbsseo]//download.csdn.net/download/gongjunhui/2774793?utm_source=bbsseo[/url]
文章热词 机器学习教程 Objective-C培训 交互设计视频教程 颜色模型 设计制作学习
相关热词 mysql关联查询两次本表 native底部 react extjs glyph 图标 深度学习教程中文版 深度学习java中文版
我们是很有底线的