非扫描版中文版《Deep Learning》深度学习圣经-Ian Goodfellow下载 [问题点数:0分]

Bbs1
本版专家分:0
结帖率 70.98%
深度学习中文版,高清非扫描可复制PDF)-IanGoodfellow(伊恩·古德费洛) 著
<em>深度学习</em>(<em>中文版</em>,高清非<em>扫描</em>可复制PDF)-IanGoodfellow(伊恩·古德费洛) 著 <em>深度学习</em>(<em>中文版</em>,高清非<em>扫描</em>可复制PDF)-IanGoodfellow(伊恩·古德费洛) 著 <em>深度学习</em>(<em>中文版</em>,高清非<em>扫描</em>可复制PDF)-IanGoodfellow(伊恩·古德费洛) 著
Deep Learning-Ian Goodfellow (2017)带书签、高清可复制PDF
Deep Learning-Ian Goodfellow, Yoshua Bengio, Aaron Courville(2017)带书签、高清可复制PDF。<em>深度学习</em>教父级书籍。 本书被组织为三个部分:第一部分介绍了基本的数学工具和机器学习的概念;第二部分介绍了本质上已解决的技术、最成熟的<em>深度学习</em>算法;第三部分介绍了被广泛认为是<em>深度学习</em>未来研究重点的但更具猜测性的想法。
深度学习Ian Goodfellow中英文版
专门从网站上<em>下载</em>,以便大家,有需要可以好评,谢谢大家.
Deep Learning (Ian GoodFellow 等著) 完整高清版
MIT Deep Learning 大师 Ian GoodFellow 等著的 Deep Learing 书籍。
Ian Goodfellow,Yoshua Bengio合著《深度学习》教材,2017年最新中文版下载
Ian Goodfellow,Yoshua Bengio合著《<em>深度学习</em>》教材,2017年最新<em>中文版</em><em>下载</em>。nn链接:https://pan.baidu.com/s/1gf7o7eznn密码:ybg7nn密码:<em>扫描</em>下方二维码,回复关键字“new”即可。还有更多关于深度强化学习,斯坦福2017年最新Tensorflow视频教程,生成对抗网络GAN视频教程。
深度学习(伊恩·古德费洛 (Ian Goodfellow))——(中文版、英文版两本)
《<em>深度学习</em>》由全球知名的三位专家Ian Goodfellow、Yoshua Bengio 和Aaron Courville撰写,是<em>深度学习</em>领域奠基性的经典教材。全书的内容包括3个部分:第 1部分介绍基本的数学工具和机器学习的概念,它们是<em>深度学习</em>的预备知识;第 2部分系统深入地讲解现今已成熟的<em>深度学习</em>方法和技术;第3部分讨论某些具有前瞻性的方向和想法,它们被公认为是<em>深度学习</em>未来的研究重点。 《<em>深度学习</em>》适合各类读者阅读,包括相关专业的大学生或研究生,以及不具有机器学习或统计背景、但是想要快速补充<em>深度学习</em>知识,以便在实际产品或平台中应用的软件工程师。
Ian Goodfellow等人的深度学习 Deep Learning 中文版(PDF)
Ian Goodfellow等人的Deep Learning <em>中文版</em>(PDF),我还上传了一份英文版,可以搜索<em>下载</em>
deep learning_Ian Goodfellow (英文原著+中文翻译版)
原书地址 http://www.<em>deep</em><em>learning</em>book.org/ , <em>中文版</em>地址 https://github.com/exacity/<em>deep</em><em>learning</em>book-chinese 。 分享给大家,希望我们一起进步。
Ian Goodfellow等人的Deep Learning 英文版(含PDF、mobi和epub)
Ian Goodfellow等人的Deep Learning 英文版(含PDF、mobi和epub),我还上传了一份<em>中文版</em>,可以搜索<em>下载</em>
深度学习中文版)(Ian Goodfellow, Yoshua Bengio, Aaron Courville)
<em>深度学习</em>领域的三位大牛撰写的,是<em>中文版</em>,带完整书签。
深度学习 deep learning pdf AI圣经.pdf下载 中文版 带封面
AI<em>圣经</em>!<em>深度学习</em>领域奠基性的经典畅销书!长期位居美国亚马逊AI和机器学习类图书榜首!所有数据科学家和机器学习从业者的必读图书!
深度学习 Deep Learning Ian Goodfellow 赵申剑等 pdf
<em>深度学习</em> pdf 文字版,带书签整合版,文件太大,压缩了一下。 作者: 【美】Ian Goodfellow(伊恩·古德费洛) , 【加】Yoshua Bengio(约书亚·本吉奥) , 【加】Aaron Courville(亚伦·库维尔) 译者: 赵申剑 , 黎彧君 , 李凯 , 符天凡
深度学习(Deep Learning)byIan Goodfellow and Yoshua Bengio and Aaron Courville.pdf
<em>深度学习</em>(Deep Learning)byIan Goodfellow and Yoshua Bengio and Aaron Courville.pdf<em>深度学习</em>(Deep Learning)byIan Goodfellow and Yoshua Bengio and Aaron Courville.pdf
深度学习 中文版 作者 IanGoodfellow、YoshuaBengio和AaronCourville
《<em>深度学习</em>》由全球知名的三位专家IanGoodfellow、YoshuaBengio和AaronCourville撰写,是<em>深度学习</em>领域奠基性的经典教材。全书的内容包括3个部分:第1部分介绍基本的数学工具和机器学习的概念,它们是<em>深度学习</em>的预备知识;第2部分系统深入地讲解现今已成熟的<em>深度学习</em>方法和技术;第3部分讨论某些具有前瞻性的方向和想法,它们被公认为是<em>深度学习</em>未来的研究重点。   《<em>深度学习</em>》适合各类读者阅读,包括相关专业的大学生或研究生,以及不具有机器学习或统计背景、但是想要快速补充<em>深度学习</em>知识,以便在实际产品或平台中应用的软件工程师。
Deep Learning Ian Goodfellow Yoshua Bengio ( (深度学习英文版)
非图片版的,可全文搜索的英文版电子书。作者:Ian Goodfellow,Yoshua Bengio,Aaron Courville此书共有802页。
深度学习(Deep Learning by Yoshua Bengio & Ian GoodFellow )学习笔记】第一部分(应用数学与机器学习基础)——线性代数
线性代数nn线性代数主要面向连续数学,而非离散数学,所以很多计算机科学家很少接触它。然而掌握好线性代数对理解和从事机器学习算法相关工作时很有必要的。nn1.1 标量、向量、矩阵和张量nn标量(scalar): 一个标量就是单独一个数。通常用斜体、小写表示。介绍标量时,通常会明确表示它所属的类型。n 如:定义实数标量:会说“令s∈ R”表示一条斜率。n 向量(vector): 一个向量就是一列有序排...
深度学习》 Ian Goodfellow、Yoshua Bengio 和Aaron Courville撰写
<em>深度学习</em>》由全球知名的三位专家Ian Goodfellow、Yoshua Bengio 和Aaron Courville撰写,是<em>深度学习</em>领域奠基性的经典教材。全书的内容包括3个部分:第1部分介绍基本的数学工具和机器学习的概念,它们是<em>深度学习</em>的预备知识;第2部分系统深入地讲解现今已成熟的<em>深度学习</em>方法和技术;第3部分讨论某些具有前瞻性的方向和想法,它们被公认为是<em>深度学习</em>未来的研究重点。 《<em>深度学习</em>》适合各类读者阅读,包括相关专业的大学生或研究生,以及不具有机器学习或统计背景、但是想要快速补充<em>深度学习</em>知识,以便在实际产品或平台中应用的软件工程师。
深度学习(Goodfellow, Yoshua Bengio, Aaron Courville)
由机器学习界三位大神Ian Goodfellow, Yoshua Bengio, Aaron Courville编写的经典之作。
deep learning 英文原版
作者: Ian Goodfellow Yoshua Bengio Aaron Courville,<em>深度学习</em>必看书籍
深度学习 [美]Ian Goodfellow(伊恩·古德费洛) 2017-07 PDF + 源码.rar
AI<em>圣经</em>!<em>深度学习</em>领域奠基性的经典畅销书!长期位居美国亚马逊AI和机器学习类图书榜首!所有数据科学家和机器学习从业者的必读图书!特斯拉CEO埃隆·马斯克等国内外众多专家推荐! <em>深度学习</em>是机器学习的一个分支,它能够使计算机通过层次概念来学习经验和理解世界。因为计算机能够从经验中获取知识,所以不需要人类来形式化地定义计算机需要的所有知识。层次概念允许计算机通过构造简单的概念来学习复杂的概念,而这些分层的图结构将具有很深的层次。本书会介绍<em>深度学习</em>领域的许多主题。 本书囊括了数学及相关概念的背景知识,包括线性代数、概率论、信息论、数值优化以及机器学习中的相关内容。同时,它还介绍了工业界中实践者用到的<em>深度学习</em>技术,包括深度前馈网络、正则化、优化算法、卷积网络、序列建模和实践方法等,并且调研了诸如自然语言处理、语音识别、计算机视觉、在线推荐系统、生物信息学以及视频游戏方面的应用。*后,本书还提供了一些研究方向,涵盖的理论主题包括线性因子模型、自编码器、表示学习、结构化概率模型、蒙特卡罗方法、配分函数、近似推断以及深度生成模型。 《<em>深度学习</em>》这本书既可以被本科生或研究生用于规划其学术界或工业界生涯,也适用于希望在各种产品或平台上开始使用<em>深度学习</em>技术的软件工程师。作者在本书的配套网站上为读者和教师提供了补充资料。<em>中文版</em>读者可以访问人民邮电出版社异步社区www.epubit.com.cn获取相关信息。 封面特色: 由艺术家Daniel Ambrosi提供的中央公园杜鹃花步道梦幻景观。在Ambrosi的亿级像素全景图上,应用Joseph Smarr(Google)和Chirs Lamb(NVIDIA)修改后的Google DeepDream开源程序,创造了Daniel Ambrosi的“幻景”。 内容简介 《<em>深度学习</em>》由全球知名的三位专家Ian Goodfellow、Yoshua Bengio 和Aaron Courville撰写,是<em>深度学习</em>领域奠基性的经典教材。全书的内容包括3个部分:第1部分介绍基本的数学工具和机器学习的概念,它们是<em>深度学习</em>的预备知识;第2部分系统深入地讲解现今已成熟的<em>深度学习</em>方法和技术;第3部分讨论某些具有前瞻性的方向和想法,它们被公认为是<em>深度学习</em>未来的研究重点。 《<em>深度学习</em>》适合各类读者阅读,包括相关专业的大学生或研究生,以及不具有机器学习或统计背景、但是想要快速补充<em>深度学习</em>知识,以便在实际产品或平台中应用的软件工程师。 作者简介 作者简介 Ian Goodfellow,谷歌公司(Google) 的研究科学家,2014 年蒙特利尔大学机器学习博士。他的研究兴趣涵盖大多数<em>深度学习</em>主题,特别是生成模型以及机器学习的安全和隐私。Ian Goodfellow 在研究对抗样本方面是一位有影响力的早期研究者,他发明了生成式对抗网络,在<em>深度学习</em>领域贡献卓越。 Yoshua Bengio,蒙特利尔大学计算机科学与运筹学系(DIRO) 的教授,蒙特利尔学习算法研究所(MILA) 的负责人,CIFAR 项目的共同负责人,加拿大统计学习算法研究主席。Yoshua Bengio 的主要研究目标是了解产生智力的学习原则。他还教授“机器学习”研究生课程(IFT6266),并培养了一大批研究生和博士后。 Aaron Courville,蒙特利尔大学计算机科学与运筹学系的助理教授,也是LISA 实验室的成员。目前他的研究兴趣集中在发展<em>深度学习</em>模型和方法,特别是开发概率模型和新颖的推断方法。Aaron Courville 主要专注于计算机视觉应用,在其他领域,如自然语言处理、音频信号处理、语音理解和其他AI 相关任务方面也有所研究。 <em>中文版</em>审校者简介 张志华,北京大学数学科学学院统计学教授,北京大学大数据研究中心和北京大数据研究院数据科学教授,主要从事机器学习和应用统计学的教学与研究工作。 译者简介 赵申剑,上海交通大学计算机系硕士研究生,研究方向为数值优化和自然语言处理。 黎彧君,上海交通大学计算机系博士研究生,研究方向为数值优化和强化学习。 符天凡,上海交通大学计算机系硕士研究生,研究方向为贝叶斯推断。 李凯,上海交通大学计算机系博士研究生,研究方向为博弈论和强化学习。 目  录 第1章引言1 1.1本书面向的读者7 1.2<em>深度学习</em>的历史趋势8 1.2.1神经网络的众多名称和命运变迁8 1.2.2与日俱增的数据量12 1.2.3与日俱增的模型规模13 1.2.4与日俱增的精度、复杂度和对现实世界的冲击15 第1部分应用数学与机器学习基础 第2章线性代数19 2.1标量、向量、矩阵和张量19 2.2矩阵和向量相乘21 2.3单位矩阵和逆矩阵22 2.4线性相关和生成子空间23 2.5范数24 2.6特殊类型的矩阵和向量25 2.7特征分解26 2.8奇异值分解28 2.9Moore-Penrose伪逆28 2.10迹运算29 2.11行列式30 2.12实例:主成分分析.30 第3章概率与信息论.34 3.1为什么要使用概率34 3.2随机变量35 3.3概率分布36 3.3.1离散型变量和概率质量函数36 3.3.2连续型变量和概率密度函数36 3.4边缘概率37 3.5条件概率37 3.6条件概率的链式法则38 3.7独立性和条件独立性38 3.8期望、方差和协方差38 3.9常用概率分布39 3.9.1Bernoulli分布40 3.9.2Multinoulli分布40 3.9.3高斯分布40 3.9.4指数分布和Laplace分布41 3.9.5Dirac分布和经验分布42 3.9.6分布的混合42 3.10常用函数的有用性质43 3.11贝叶斯规则45 3.12连续型变量的技术细节45 3.13信息论47 3.14结构化概率模型49 第4章数值计算52 4.1上溢和下溢52 4.2病态条件53 4.3基于梯度的优化方法53 4.3.1梯度之上:Jacob<em>ian</em>和Hess<em>ian</em>矩阵56 4.4约束优化60 4.5实例:线性最小二乘61 第5章机器学习基础.63 5.1学习算法63 5.1.1任务T63 5.1.2性能度量P66 5.1.3经验E66 5.1.4示例:线性回归68 5.2容量、过拟合和欠拟合70 5.2.1没有免费午餐定理73 5.2.2正则化74 5.3超参数和验证集76 5.3.1交叉验证76 5.4估计、偏差和方差.77 5.4.1点估计77 5.4.2偏差78 5.4.3方差和标准差80 5.4.4权衡偏差和方差以最小化均方误差81 5.4.5一致性82 5.5最大似然估计82 5.5.1条件对数似然和均方误差84 5.5.2最大似然的性质84 5.6贝叶斯统计85 5.6.1最大后验(MAP)估计87 5.7监督学习算法88 5.7.1概率监督学习88 5.7.2支持向量机88 5.7.3其他简单的监督学习算法90 5.8无监督学习算法91 5.8.1主成分分析92 5.8.2k-均值聚类.94 5.9随机梯度下降94 5.10构建机器学习算法96 5.11促使<em>深度学习</em>发展的挑战96 5.11.1维数灾难97 5.11.2局部不变性和平滑正则化97 5.11.3流形学习99 第2部分深度网络:现代实践 第6章深度前馈网络105 6.1实例:学习XOR107 6.2基于梯度的学习110 6.2.1代价函数111 6.2.2输出单元113 6.3隐藏单元119 6.3.1整流线性单元及其扩展120 6.3.2logisticsigmoid与双曲正切函数121 6.3.3其他隐藏单元122 6.4架构设计123 6.4.1万能近似性质和深度.123 6.4.2其他架构上的考虑.126 6.5反向传播和其他的微分算法.126 6.5.1计算图127 6.5.2微积分中的链式法则.128 6.5.3递归地使用链式法则来实现反向传播128 6.5.4全连接MLP中的反向传播计算131 6.5.5符号到符号的导数.131 6.5.6一般化的反向传播.133 6.5.7实例:用于MLP训练的反向传播.135 6.5.8复杂化137 6.5.9<em>深度学习</em>界以外的微分137 6.5.10高阶微分138 6.6历史小记139 第7章<em>深度学习</em>中的正则化141 7.1参数范数惩罚142 7.1.1L2参数正则化142 7.1.2L1正则化144 7.2作为约束的范数惩罚146 7.3正则化和欠约束问题147 7.4数据集增强148 7.5噪声鲁棒性149 7.5.1向输出目标注入噪声.150 7.6半监督学习150 7.7多任务学习150 7.8提前终止151 7.9参数绑定和参数共享156 7.9.1卷积神经网络156 7.10稀疏表示.157 7.11Bagging和其他集成方法.158 7.12Dropout159 7.13对抗训练.165 7.14切面距离、正切传播和流形正切分类器167 第8章深度模型中的优化.169 8.1学习和纯优化有什么不同169 8.1.1经验风险最小化169 8.1.2代理损失函数和提前终止170 8.1.3批量算法和小批量算法170 8.2神经网络优化中的挑战173 8.2.1病态173 8.2.2局部极小值174 8.2.3高原、鞍点和其他平坦区域.175 8.2.4悬崖和梯度爆炸177 8.2.5长期依赖177 8.2.6非精确梯度178 8.2.7局部和全局结构间的弱对应178 8.2.8优化的理论限制179 8.3基本算法180 8.3.1随机梯度下降180 8.3.2动量181 8.3.3Nesterov动量.183 8.4参数初始化策略184 8.5自适应学习率算法187 8.5.1AdaGrad187 8.5.2RMSProp188 8.5.3Adam189 8.5.4选择正确的优化算法.190 8.6二阶近似方法190 8.6.1牛顿法190 8.6.2共轭梯度191 8.6.3BFGS193 8.7优化策略和元算法194 8.7.1批标准化194 8.7.2坐标下降196 8.7.3Polyak平均197 8.7.4监督预训练197 8.7.5设计有助于优化的模型199 8.7.6延拓法和课程学习.199 第9章卷积网络201 9.1卷积运算201 9.2动机203 9.3池化207 9.4卷积与池化作为一种无限强的先验210 9.5基本卷积函数的变体211 9.6结构化输出218 9.7数据类型219 9.8高效的卷积算法220 9.9随机或无监督的特征220 9.10卷积网络的神经科学基础221 9.11卷积网络与<em>深度学习</em>的历史226 第10章序列建模:循环和递归网络227 10.1展开计算图228 10.2循环神经网络230 10.2.1导师驱动过程和输出循环网络232 10.2.2计算循环神经网络的梯度233 10.2.3作为有向图模型的循环网络235 10.2.4基于上下文的RNN序列建模237 10.3双向RNN239 10.4基于编码-解码的序列到序列架构240 10.5深度循环网络242 10.6递归神经网络243 10.7长期依赖的挑战244 10.8回声状态网络245 10.9渗漏单元和其他多时间尺度的策略247 10.9.1时间维度的跳跃连接.247 10.9.2渗漏单元和一系列不同时间尺度247 10.9.3删除连接248 10.10长短期记忆和其他门控RNN248 10.10.1LSTM248 10.10.2其他门控RNN250 10.11优化长期依赖.251 10.11.1截断梯度251 10.11.2引导信息流的正则化252 10.12外显记忆253 第11章实践方法论256 11.1性能度量.256 11.2默认的基准模型258 11.3决定是否收集更多数据259 11.4选择超参数259 11.4.1手动调整超参数259 11.4.2自动超参数优化算法.262 11.4.3网格搜索262 11.4.4随机搜索263 11.4.5基于模型的超参数优化264 11.5调试策略.264 11.6示例:多位数字识别267 第12章应用.269 12.1大规模<em>深度学习</em>269 12.1.1快速的CPU实现269 12.1.2GPU实现269 12.1.3大规模的分布式实现.271 12.1.4模型压缩271 12.1.5动态结构272 12.1.6深度网络的专用硬件实现273 12.2计算机视觉274 12.2.1预处理275 12.2.2数据集增强277 12.3语音识别.278 12.4自然语言处理279 12.4.1n-gram.280 12.4.2神经语言模型281 12.4.3高维输出282 12.4.4结合n-gram和神经语言模型286 12.4.5神经机器翻译287 12.4.6历史展望289 12.5其他应用.290 12.5.1推荐系统290 12.5.2知识表示、推理和回答292 第3部分<em>深度学习</em>研究 第13章线性因子模型297 13.1概率PCA和因子分析297 13.2独立成分分析298 13.3慢特征分析300 13.4稀疏编码.301 13.5PCA的流形解释304 第14章自编码器306 14.1欠完备自编码器306 14.2正则自编码器307 14.2.1稀疏自编码器307 14.2.2去噪自编码器309 14.2.3惩罚导数作为正则.309 14.3表示能力、层的大小和深度310 14.4随机编码器和解码器.310 14.5去噪自编码器详解311 14.5.1得分估计312 14.5.2历史展望314 14.6使用自编码器学习流形314 14.7收缩自编码器317 14.8预测稀疏分解319 14.9自编码器的应用319 第15章表示学习321 15.1贪心逐层无监督预训练322 15.1.1何时以及为何无监督预训练有效有效323 15.2迁移学习和领域自适应326 15.3半监督解释因果关系.329 15.4分布式表示332 15.5得益于深度的指数增益336 15.6提供发现潜在原因的线索337 第16章<em>深度学习</em>中的结构化概率模型339 16.1非结构化建模的挑战.339 16.2使用图描述模型结构.342 16.2.1有向模型342 16.2.2无向模型344 16.2.3配分函数345 16.2.4基于能量的模型346 16.2.5分离和d-分离.347 16.2.6在有向模型和无向模型中转换350 16.2.7因子图352 16.3从图模型中采样353 16.4结构化建模的优势353 16.5学习依赖关系354 16.6推断和近似推断354 16.7结构化概率模型的<em>深度学习</em>方法.355 16.7.1实例:受限玻尔兹曼机356 第17章蒙特卡罗方法359 17.1采样和蒙特卡罗方法.359 17.1.1为什么需要采样359 17.1.2蒙特卡罗采样的基础.359 17.2重要采样.360 17.3马尔可夫链蒙特卡罗方法362 17.4Gibbs采样.365 17.5不同的峰值之间的混合挑战365 17.5.1不同峰值之间通过回火来混合367 17.5.2深度也许会有助于混合368 第18章直面配分函数369 18.1对数似然梯度369 18.2随机最大似然和对比散度370 18.3伪似然375 18.4得分匹配和比率匹配.376 18.5去噪得分匹配378 18.6噪声对比估计378 18.7估计配分函数380 18.7.1退火重要采样382 18.7.2桥式采样384 第19章近似推断385 19.1把推断视作优化问题.385 19.2期望最大化386 19.3最大后验推断和稀疏编码387 19.4变分推断和变分学习.389 19.4.1离散型潜变量390 19.4.2变分法394 19.4.3连续型潜变量396 19.4.4学习和推断之间的相互作用397 19.5学成近似推断397 19.5.1醒眠算法398 19.5.2学成推断的其他形式.398 第20章深度生成模型399 20.1玻尔兹曼机399 20.2受限玻尔兹曼机400 20.2.1条件分布401 20.2.2训练受限玻尔兹曼机.402 20.3深度信念网络402 20.4深度玻尔兹曼机404 20.4.1有趣的性质406 20.4.2DBM均匀场推断406 20.4.3DBM的参数学习408 20.4.4逐层预训练408 20.4.5联合训练深度玻尔兹曼机410 20.5实值数据上的玻尔兹曼机413 20.5.1Gauss<em>ian</em>-BernoulliRBM413 20.5.2条件协方差的无向模型414 20.6卷积玻尔兹曼机417 20.7用于结构化或序列输出的玻尔兹曼机418 20.8其他玻尔兹曼机419 20.9通过随机操作的反向传播419 20.9.1通过离散随机操作的反向传播420 20.10有向生成网络.422 20.10.1sigmoid信念网络422 20.10.2可微生成器网络.423 20.10.3变分自编码器.425 20.10.4生成式对抗网络.427 20.10.5生成矩匹配网络.429 20.10.6卷积生成网络.430 20.10.7自回归网络430 20.10.8线性自回归网络.430 20.10.9神经自回归网络.431 20.10.10NADE432 20.11从自编码器采样433 20.11.1与任意去噪自编码器相关的马尔可夫链434 20.11.2夹合与条件采样.434 20.11.3回退训练过程.435 20.12生成随机网络.435 20.12.1判别性GSN436 20.13其他生成方案.436 20.14评估生成模型.437 20.15结论438 参考文献.439 索引486
deep learning (中文版)Lan Goodfellow Yoshua Bengio
对于那些刚接触<em>深度学习</em>,而不知道学习什么的人来说,这本书会给出一个清晰的学习计划和详细的内容。本文由Lan Goodfellow,Yoshua Bengio,Aaron Courville合作完成,其中Lan被誉为“GAN之父”,Yoshua Bengio也是<em>深度学习</em>研究领域的专家。
Deep Learning——Ian Goodfellow, Yoshua Bengio and Aaron Courville
【<em>深度学习</em>】经过两年半的努力,由谷歌大脑团队科学家 Ian Goodfellow, Yoshua Bengio and Aaron Courville撰写MIT出版的《Deep Learning》,终稿的pdf版本,带书签。因为超过了60M,所以压缩了一下
深度学习-中文版.mobi
《<em>深度学习</em>》由全球知名的三位专家Ian Goodfellow、Yoshua Bengio 和Aaron Courville撰写,是<em>深度学习</em>领域奠基性的经典教材。全书的内容包括3个部分:第1部分介绍基本的数学工具和机器学习的概念,它们是<em>深度学习</em>的预备知识;第2部分系统深入地讲解现今已成熟的<em>深度学习</em>方法和技术;第3部分讨论某些具有前瞻性的方向和想法,它们被公认为是<em>深度学习</em>未来的研究重点。 《<em>深度学习</em>》适合各类读者阅读,包括相关专业的大学生或研究生,以及不具有机器学习或统计背景、但是想要快速补充<em>深度学习</em>知识,以便在实际产品或平台中应用的软件工程师。
Bengio写的MIT Press《Deep learning》PDF整理版
<em>深度学习</em>,MIT,<em>deep</em> <em>learning</em>, Yoshua Bengio,Ian Goodfellow,Aaron Courville
深度学习 英文原版 Deep Learning(Ian Goodfellow Yoshua Bengio)
<em>深度学习</em>经典书籍,Deep Learning(Ian Goodfellow Yoshua Bengio)
Deep Learning ( Ian Goodfellow Yoshua Bengio Aaron Courville)
Deep Learning 英文版,文字,非影印,高清。 Deep Learning ( Ian Goodfellow Yoshua Bengio Aaron Courville)
《DEEP LEARNING》中文版 超清扫描PDF版本
书名:DEEP LEARNING 作者:Ian Goodfellow, Yoshua Bengio, Aaron Courville 中文书名:《<em>深度学习</em>》 目录: 第一章(引言) 第二章(线性代数) 第三章(概率与信息论) 第四章(数值计算) 第五章(机器学习基础) 第六章(深度前馈网络) 第七章(<em>深度学习</em>中的正则化) 第八章(深度模型中的优化) 第九章(卷积网络) 第十章(序列建模:循环和递归网络 第十一章(实践方法论) 第十二章(应用) 第十三章(线性因子模型) 第十五章(表示学习) 第十六章(<em>深度学习</em>中的结构化概率模型) 第十八章(直面配分函数) 第十九章(近似推断) 第二十章(深度生成模型)
深度学习-deep learning-AI圣经(高清中文带书签版)PDF下载
“本书名为《<em>深度学习</em>》被称为AI<em>圣经</em>,是一本不可多得的<em>深度学习</em>书籍,是由<em>深度学习</em>领域大牛所写,写作初衷是为了写一本<em>深度学习</em>经典指导书籍。 n本书是全本内容,为中文高清版,带有书签查阅非常方便。 n相信会给你带来不一样的阅读感受。 n链接:https://pan.baidu.com/s/1oeIFu5UpqI–ZQpcd7JTVg n密码:jt9u n“...
AI圣经deeplearning(百度云自行下载,免费)
各位大佬,链接在下方,求一本《<em>深度学习</em>、优化与识别》的pdf,链接:https://pan.baidu.com/s/1Ao9p7P3gRYhvMYatpZxRjA 密码:99ae
深度学习-IanGoodfellow(伊恩·古德费洛)2017最新中文版 高清无水印
伊恩·古德费洛 (Ian Goodfellow) (作者), 约书亚·本吉奥 (Yoshua Bengio) (作者), 亚伦·库维尔 (Aaron Courville) (作者), 赵申剑 (译者), 黎彧君 (译者), 符天凡 (译者), 李凯 (译者) 版本 2017.9.4 本书内含网站,提供了各种补充材料,包括练习、讲义幻灯片、错误更正以及其他应该对读者和讲师有用的资源.
深度学习 Deep Learning book, MIT, Ian Goodfellow, Aaron Courville, and Yoshua Bengio
非常棒的<em>深度学习</em>课本 MIT Deep Learning Book in PDF format This book was downloaded in HTML form and conviniently joined as a single PDF file for your enjoyment. Please notice the known issues in the web page, especially with regards to some symbols not rendering well or not at all. From http://www.<em>deep</em><em>learning</em>book.org/ An MIT Press book Ian Goodfellow, Yoshua Bengio and Aaron Courville The Deep Learning textbook is a resource intended to help students and practitioners enter the field of machine <em>learning</em> in general and <em>deep</em> <em>learning</em> in particular. The online version of the book is now complete and will remain available online for free. The print version will be available for sale soon.
Deep Learning (Ian Goodfellow, Yoshua Bengio and Aaron Courville)
Deep Learning (Ian Goodfellow, Yoshua Bengio and Aaron Courville)
深度学习 AI圣经 deep learning 中文文字版 带书签 完整版(700多页)
AI<em>圣经</em>!<em>深度学习</em>领域奠基性的经典畅销书!长期位居美国亚马逊AI和机器学习类图书榜首!所有数据科学家和机器学习从业者的必读图书!特斯拉CEO埃隆·马斯克等国内外众多专家推荐! <em>深度学习</em>是机器学习的一个分支,它能够使计算机通过层次概念来学习经验和理解世界。因为计算机能够从经验中获取知识,所以不需要人类来形式化地定义计算机需要的所有知识。层次概念允许计算机通过构造简单的概念来学习复杂的概念,而这些分层的图结构将具有很深的层次。本书会介绍<em>深度学习</em>领域的许多主题。 本书囊括了数学及相关概念的背景知识,包括线性代数、概率论、信息论、数值优化以及机器学习中的相关内容。同时,它还介绍了工业界中实践者用到的<em>深度学习</em>技术,包括深度前馈网络、正则化、优化算法、卷积网络、序列建模和实践方法等,并且调研了诸如自然语言处理、语音识别、计算机视觉、在线推荐系统、生物信息学以及视频游戏方面的应用。*后,本书还提供了一些研究方向,涵盖的理论主题包括线性因子模型、自编码器、表示学习、结构化概率模型、蒙特卡罗方法、配分函数、近似推断以及深度生成模型。 《<em>深度学习</em>》这本书既可以被本科生或研究生用于规划其学术界或工业界生涯,也适用于希望在各种产品或平台上开始使用<em>深度学习</em>技术的软件工程师。作者 在本书的配套网站上为读者和教师提供了补充资料。<em>中文版</em>读者可以访问人民邮电出版社异步社区www.epubit.com.cn获取相关信息。
《Deep Learning》Ian Goodfellow, Yoshua Bengio and Aaron Courville【带书签】
Bengio大神的《Deep Learning》全书已完稿,这里对目录整理了一下书签,方便查看
ai圣经 深度 学习 高清 - Ai圣经高清中文版 深度学习 完整pdf
Ai<em>圣经</em>高清<em>中文版</em> <em>深度学习</em> Ai<em>圣经</em>高清<em>中文版</em> <em>深度学习</em> Ai<em>圣经</em>高清<em>中文版</em> <em>深度学习</em>
deep learning book(Ian Goodfellow Yoshua Bengio Aaron Courville)
<em>deep</em> <em>learning</em> book from basic to advanced topics, best book for you to start <em>learning</em> <em>deep</em> <em>learning</em>
深度学习(电子书 文字版 完整版)Ian Goodfellow、Yoshua Bengio 和Aaron Courville
申明:本资源来源于互联网,如有侵权,请联系本人或者CSDN进行删除,谢谢! 《<em>深度学习</em>》由全球知名的三位专家Ian Goodfellow、Yoshua Bengio 和Aaron Courville撰写,是<em>深度学习</em>领域奠基性的经典教材。全书的内容包括3个部分:第1部分介绍基本的数学工具和机器学习的概念,它们是<em>深度学习</em>的预备知识;第2部分系统深入地讲解现今已成熟的<em>深度学习</em>方法和技术;第3部分讨论某些具有前瞻性的方向和想法,它们被公认为是<em>深度学习</em>未来的研究重点。 《<em>深度学习</em>》适合各类读者阅读,包括相关专业的大学生或研究生,以及不具有机器学习或统计背景、但是想要快速补充<em>深度学习</em>知识,以便在实际产品或平台中应用的软件工程师。 申明:本资源来源于互联网,如有侵权,请联系本人或者CSDN进行删除,谢谢!
深度学习(deep learning) AI圣经 中文+高清+目录
《<em>深度学习</em>》由全球知名的三位专家Ian Goodfellow、Yoshua Bengio 和Aaron Courville撰写,是<em>深度学习</em>领域奠基性的经典教材。全书的内容包括3个部分:第 1部分介绍基本的数学工具和机器学习的概念,它们是<em>深度学习</em>的预备知识;第 2部分系统深入地讲解现今已成熟的<em>深度学习</em>方法和技术;第3部分讨论某些具有前瞻性的方向和想法,它们被公认为是<em>深度学习</em>未来的研究重点。 《<em>深度学习</em>》适合各类读者阅读,包括相关专业的大学生或研究生,以及不具有机器学习或统计背景、但是想要快速补充<em>深度学习</em>知识,以便在实际产品或平台中应用的软件工程师。
深度学习圣经中文版+英文版高清PDF
作者Ian Goodfellow,Yoshua Bengio,Aaron Courville。伊恩·古德费洛等 。美亚人工智能和<em>深度学习</em>排名第一的畅销书。这本书对各类读者都有一定用处,但我们主要是为两类受众对象而写的。其中一类受众对象是学习机器学习的大学生(本科或研究生),包括那些已经开始职业 生涯的<em>深度学习</em>和人工智能研究者。另一类受众对象是没有机器学习或统计背景但希望能快速地掌握这方面知识并在他们的产品或平台中使用<em>深度学习</em>的软件工程师。<em>深度学习</em>在许多软件领域都已被证明是有用的,包括计算机视觉、语音和音频处理、自然语言处理、机器人技术、生物信息学和化学、电子游戏、搜索引擎、网络广告和金融。
深度学习 PDF 作者:[美]Ian Goodfellow(伊恩·古德费洛)
<em>深度学习</em> PDF 作者:[美]Ian Goodfellow(伊恩·古德费洛) & [加]Aaron Courville(亚伦·库维尔) & [加]Yoshua Bengio(约书亚·本吉奥)
深度学习(Deep Learning) Yoshua Bengio & Ian GoodFellow中文版
<em>深度学习</em>(Deep Learning) Yoshua Bengio & Ian GoodFellow<em>中文版</em>
中文版+英文版-deep+Learning(Yoshua+Bengio+Ian+GoodFellow).zip
<em>中文版</em>+英文版-<em>deep</em>+Learning(Yoshua+Bengio+Ian+GoodFellow),<em>deep</em> <em>learning</em> 三位学术大牛的经典之作。
《Deep Learning》全书已完稿_附全书电子版
Bengio大神的《Deep Learning》全书。经过两年半的努力,由谷歌大脑团队科学家 Ian Goodfellow, Yoshua Bengio and Aaron Courville撰写MIT出版的《Deep Learning》,今天完成最终稿了。提供整本书的<em>下载</em>链接。
《Deep learning深度学习》英文原版PDF格式
作者: Ian Goodfellow Yoshua Bengio Aaron Courville 完整整合版,内容清晰,内附目录书签,方便浏览
杰哥的《深度学习》读书笔记 - 前言
最近开始学<em>深度学习</em>(Deep Learning,DL),主要是读Ian Goodfellow, Yoshua Bengio和Aaron Courville合著的《<em>深度学习</em>》一书。我打算边读边写读书笔记,一方面是巩固知识,一方面也是分享给同路中人,并希望得到大家的反馈。
深度学习Deep Learning 》中文版 高清完整PDF版 下载
AI<em>圣经</em> Deep Learning<em>中文版</em> 长期位居美国ya马逊人工智能和机器学习类图书榜首 <em>深度学习</em>领域奠基性的经典畅销书 特斯拉CEO埃隆·马斯克等国内外众多专家推荐
深度学习-deep learning-AI圣经(高清带书签版)
本书名为《<em>深度学习</em>》被称为AI<em>圣经</em>,是一本不可多得的<em>深度学习</em>书籍,是由<em>深度学习</em>领域大牛所写,写作初衷是为了写一本<em>深度学习</em>经典指导书籍。 本书是全本内容,为中文高清版,带有书签查阅非常方便。 相信会给你带来不一样的阅读感受。
深度学习(Deep Learning) Yoshua Bengio & Ian GoodFellow 英文版
<em>深度学习</em>(Deep Learning) AI<em>圣经</em> Yoshua Bengio & Ian GoodFellow 英文原版
扫描中文版《Deep Learning》深度学习圣经-Ian Goodfellow
《<em>深度学习</em>》由全球知名的三位专家Ian Goodfellow、Yoshua Bengio 和Aaron Courville撰写,是<em>深度学习</em>领域奠基性的经典教材。全书的内容包括3个部分:第1部分介绍基本的数学工具和机器学习的概念,它们是<em>深度学习</em>的预备知识;第2部分系统深入地讲解现今已成熟的<em>深度学习</em>方法和技术;第3部分讨论某些具有前瞻性的方向和想法,它们被公认为是<em>深度学习</em>未来的研究重点。 《<em>深度学习</em>》适合各类读者阅读,包括相关专业的大学生或研究生,以及不具有机器学习或统计背景、但是想要快速补充<em>深度学习</em>知识,以便在实际产品或平台中应用的软件工程师。
深度学习(epub版)2017年8月1日出版
出版社: 人民邮电出版社 版次:1 外文名称:<em>deep</em> <em>learning</em> AI<em>圣经</em>!<em>深度学习</em>领域奠基性的经典畅销书!长期位居美国ya马逊AI和机器学习类图书榜首!所有数据科学家和机器学习从业者的bi读图书!特斯拉CEO埃隆·马斯克等国内外众多专家推j<em>ian</em>!   <em>深度学习</em>是机器学习的一个分支,它能够使计算机通过层次概念来学习经验和理解世界。因为计算机能够从经验中获取知识,所以不需要人类来形式化地定义计算机需要的所有知识。层次概念允许计算机通过构造简单的概念来学习复杂的概念,而这些分层的图结构将具有很深的层次。本书会介绍<em>深度学习</em>领域的许多主题。   本书囊括了数学及相关概念的背景知识,包括线性代数、概率论、信息论、数值优化以及机器学习中的相关内容。同时,它还介绍了工业界中实践者用到的<em>深度学习</em>技术,包括深度前馈网络、正则化、优化算法、卷积网络、序列建模和实践方法等,并且调研了诸如自然语言处理、语音识别、计算机视觉、在线推荐系统、生物信息学以及视频游戏方面的应用。最后,本书还提供了一些研究方向,涵盖的理论主题包括线性因子模型、自编码器、表示学习、结构化概率模型、蒙特卡罗方法、配分函数、近似推断以及深度生成模型。
深度学习Deep Learning 中文版(高清扫描带目录版)
目录 · · · · · · 第 1 章 引言 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.1 本书面向的读者 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .7 1.2 <em>深度学习</em>的历史趋势 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 1.2.1 神经网络的众多名称和命运变迁 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 1.2.2 与日俱增的数据量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 1.2.3 与日俱增的模型规模 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .13 1.2.4 与日俱增的精度、复杂度和对现实世界的冲击 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 第 1 部分 应用数学与机器学习基础 第 2 章 线性代数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 2.1 标量、向量、矩阵和张量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 2.2 矩阵和向量相乘. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .21 2.3 单位矩阵和逆矩阵 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 2.4 线性相关和生成子空间 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 2.5 范数. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .24 2.6 特殊类型的矩阵和向量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 2.7 特征分解 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 2.8 奇异值分解 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 2.9 Moore-Penrose 伪逆 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 2.10 迹运算 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 2.11 行列式 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 2.12 实例:主成分分析. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .30 第 3 章 概率与信息论. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .34 3.1 为什么要使用概率 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 3.2 随机变量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 3.3 概率分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 3.3.1 离散型变量和概率质量函数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 3.3.2 连续型变量和概率密度函数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 3.4 边缘概率 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 3.5 条件概率 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 3.6 条件概率的链式法则 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 3.7 独立性和条件独立性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 3.8 期望、方差和协方差 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 3.9 常用概率分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 3.9.1 Bernoulli 分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 3.9.2 Multinoulli 分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 3.9.3 高斯分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 3.9.4 指数分布和 Laplace 分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 3.9.5 Dirac 分布和经验分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 3.9.6 分布的混合 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 3.10 常用函数的有用性质. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .43 3.11 贝叶斯规则 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 3.12 连续型变量的技术细节 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 3.13 信息论 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 3.14 结构化概率模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 第 4 章 数值计算 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 4.1 上溢和下溢 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 4.2 病态条件 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 4.3 基于梯度的优化方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 4.3.1 梯度之上:Jacob<em>ian</em> 和 Hess<em>ian</em> 矩阵 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 4.4 约束优化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 4.5 实例:线性最小二乘 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 第 5 章 机器学习基础. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .63 5.1 学习算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 5.1.1 任务 T . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 5.1.2 性能度量 P . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 5.1.3 经验 E . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 5.1.4 示例:线性回归 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 5.2 容量、过拟合和欠拟合 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 5.2.1 没有免费午餐定理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 5.2.2 正则化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 5.3 超参数和验证集. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .76 5.3.1 交叉验证 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 5.4 估计、偏差和方差. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .77 5.4.1 点估计 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 5.4.2 偏差 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 5.4.3 方差和标准差 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 5.4.4 权衡偏差和方差以最小化均方误差 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 5.4.5 一致性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 5.5 最大似然估计 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 5.5.1 条件对数似然和均方误差. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .84 5.5.2 最大似然的性质 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 5.6 贝叶斯统计 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 5.6.1 最大后验 (MAP) 估计 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 5.7 监督学习算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 5.7.1 概率监督学习 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 5.7.2 支持向量机 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 5.7.3 其他简单的监督学习算法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .90 5.8 无监督学习算法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .91 5.8.1 主成分分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92 5.8.2 k-均值聚类 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .94 5.9 随机梯度下降 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 5.10 构建机器学习算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 5.11 促使<em>深度学习</em>发展的挑战 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 5.11.1 维数灾难 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 5.11.2 局部不变性和平滑正则化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 5.11.3 流形学习 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 第 2 部分 深度网络:现代实践 第 6 章 深度前馈网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 6.1 实例:学习 XOR. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 6.2 基于梯度的学习 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 6.2.1 代价函数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 6.2.2 输出单元 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 6.3 隐藏单元. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .119 6.3.1 整流线性单元及其扩展 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120 6.3.2 logistic sigmoid 与双曲正切函数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 6.3.3 其他隐藏单元 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122 6.4 架构设计. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .123 6.4.1 万能近似性质和深度. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .123 6.4.2 其他架构上的考虑 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .126 6.5 反向传播和其他的微分算法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .126 6.5.1 计算图 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 6.5.2 微积分中的链式法则. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .128 6.5.3 递归地使用链式法则来实现反向传播 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 6.5.4 全连接 MLP 中的反向传播计算 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131 6.5.5 符号到符号的导数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .131 6.5.6 一般化的反向传播 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .133 6.5.7 实例:用于 MLP 训练的反向传播 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .135 6.5.8 复杂化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137 6.5.9 <em>深度学习</em>界以外的微分 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137 6.5.10 高阶微分 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138 6.6 历史小记. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .139 第 7 章 <em>深度学习</em>中的正则化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141 7.1 参数范数惩罚 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142 7.1.1 L2 参数正则化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142 7.1.2 L1 正则化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144 7.2 作为约束的范数惩罚. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .146 7.3 正则化和欠约束问题. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .147 7.4 数据集增强 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148 7.5 噪声鲁棒性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 7.5.1 向输出目标注入噪声. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .150 7.6 半监督学习 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150 7.7 多任务学习 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150 7.8 提前终止. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .151 7.9 参数绑定和参数共享. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .156 7.9.1 卷积神经网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156 7.10 稀疏表示. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .157 7.11 Bagging 和其他集成方法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .158 7.12 Dropout . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .159 7.13 对抗训练. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .165 7.14 切面距离、正切传播和流形正切分类器 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167 第 8 章 深度模型中的优化. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .169 8.1 学习和纯优化有什么不同 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169 8.1.1 经验风险最小化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169 8.1.2 代理损失函数和提前终止 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170 8.1.3 批量算法和小批量算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170 8.2 神经网络优化中的挑战 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173 8.2.1 病态 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173 8.2.2 局部极小值 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174 8.2.3 高原、鞍点和其他平坦区域 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .175 8.2.4 悬崖和梯度爆炸 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177 8.2.5 长期依赖 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177 8.2.6 非精确梯度 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178 8.2.7 局部和全局结构间的弱对应 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178 8.2.8 优化的理论限制 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179 8.3 基本算法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .180 8.3.1 随机梯度下降 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180 8.3.2 动量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181 8.3.3 Nesterov 动量. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .183 8.4 参数初始化策略 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184 8.5 自适应学习率算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187 8.5.1 AdaGrad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187 8.5.2 RMSProp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188 8.5.3 Adam . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189 8.5.4 选择正确的优化算法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .190 8.6 二阶近似方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190 8.6.1 牛顿法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190 8.6.2 共轭梯度 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191 8.6.3 BFGS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193 8.7 优化策略和元算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194 8.7.1 批标准化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194 8.7.2 坐标下降 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196 8.7.3 Polyak 平均 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197 8.7.4 监督预训练 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197 8.7.5 设计有助于优化的模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199 8.7.6 延拓法和课程学习 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .199 第 9 章 卷积网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201 9.1 卷积运算. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .201 9.2 动机 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203 9.3 池化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207 9.4 卷积与池化作为一种无限强的先验 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 210 9.5 基本卷积函数的变体. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .211 9.6 结构化输出 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218 9.7 数据类型. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .219 9.8 高效的卷积算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 220 9.9 随机或无监督的特征. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .220 9.10 卷积网络的神经科学基础 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221 9.11 卷积网络与<em>深度学习</em>的历史 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226 第 10 章 序列建模:循环和递归网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227 10.1 展开计算图 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 228 10.2 循环神经网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .230 10.2.1 导师驱动过程和输出循环网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232 10.2.2 计算循环神经网络的梯度 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233 10.2.3 作为有向图模型的循环网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 235 10.2.4 基于上下文的 RNN 序列建模 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237 10.3 双向 RNN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239 10.4 基于编码 - 解码的序列到序列架构 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 240 10.5 深度循环网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .242 10.6 递归神经网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .243 10.7 长期依赖的挑战 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 244 10.8 回声状态网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .245 10.9 渗漏单元和其他多时间尺度的策略 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247 10.9.1 时间维度的跳跃连接. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .247 10.9.2 渗漏单元和一系列不同时间尺度 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247 10.9.3 删除连接 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 248 10.10 长短期记忆和其他门控 RNN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 248 10.10.1 LSTM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 248 10.10.2 其他门控 RNN. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .250 10.11 优化长期依赖. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .251 10.11.1 截断梯度 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251 10.11.2 引导信息流的正则化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 252 10.12 外显记忆 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253 第 11 章 实践方法论 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 256 11.1 性能度量. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .256 11.2 默认的基准模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 258 11.3 决定是否收集更多数据 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 259 11.4 选择超参数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 259 11.4.1 手动调整超参数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .259 11.4.2 自动超参数优化算法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .262 11.4.3 网格搜索 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262 11.4.4 随机搜索 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263 11.4.5 基于模型的超参数优化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 264 11.5 调试策略. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .264 11.6 示例:多位数字识别 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 267 第 12 章 应用. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .269 12.1 大规模<em>深度学习</em> . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 269 12.1.1 快速的 CPU 实现 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 269 12.1.2 GPU 实现 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 269 12.1.3 大规模的分布式实现. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .271 12.1.4 模型压缩 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271 12.1.5 动态结构 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 272 12.1.6 深度网络的专用硬件实现 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 273 12.2 计算机视觉 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 274 12.2.1 预处理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 275 12.2.2 数据集增强 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 277 12.3 语音识别. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .278 12.4 自然语言处理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .279 12.4.1 n-gram . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .280 12.4.2 神经语言模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 281 12.4.3 高维输出 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 282 12.4.4 结合 n-gram 和神经语言模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 286 12.4.5 神经机器翻译 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287 12.4.6 历史展望 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289 12.5 其他应用. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .290 12.5.1 推荐系统 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 290 12.5.2 知识表示、推理和回答 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 292 第 3 部分 <em>深度学习</em>研究 第 13 章 线性因子模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 297 13.1 概率 PCA 和因子分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 297 13.2 独立成分分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .298 13.3 慢特征分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 300 13.4 稀疏编码. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .301 13.5 PCA 的流形解释 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 304 第 14 章 自编码器 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 306 14.1 欠完备自编码器 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 306 14.2 正则自编码器 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .307 14.2.1 稀疏自编码器 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 307 14.2.2 去噪自编码器 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 309 14.2.3 惩罚导数作为正则. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .309 14.3 表示能力、层的大小和深度 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 310 14.4 随机编码器和解码器. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .310 14.5 去噪自编码器详解 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 311 14.5.1 得分估计 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 312 14.5.2 历史展望 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 314 14.6 使用自编码器学习流形 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 314 14.7 收缩自编码器 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .317 14.8 预测稀疏分解 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .319 14.9 自编码器的应用 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 319 第 15 章 表示学习 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 321 15.1 贪心逐层无监督预训练 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 322 15.1.1 何时以及为何无监督预训练有效有效 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323 15.2 迁移学习和领域自适应 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 326 15.3 半监督解释因果关系. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .329 15.4 分布式表示 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 332 15.5 得益于深度的指数增益 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 336 15.6 提供发现潜在原因的线索 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 337 第 16 章 <em>深度学习</em>中的结构化概率模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 339 16.1 非结构化建模的挑战. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .339 16.2 使用图描述模型结构. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .342 16.2.1 有向模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 342 16.2.2 无向模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 344 16.2.3 配分函数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 345 16.2.4 基于能量的模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .346 16.2.5 分离和 d-分离 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .347 16.2.6 在有向模型和无向模型中转换 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 350 16.2.7 因子图 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 352 16.3 从图模型中采样 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 353 16.4 结构化建模的优势 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 353 16.5 学习依赖关系 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .354 16.6 推断和近似推断 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 354 16.7 结构化概率模型的<em>深度学习</em>方法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .355 16.7.1 实例:受限玻尔兹曼机 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 356 第 17 章 蒙特卡罗方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 359 17.1 采样和蒙特卡罗方法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .359 17.1.1 为什么需要采样 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .359 17.1.2 蒙特卡罗采样的基础. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .359 17.2 重要采样. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .360 17.3 马尔可夫链蒙特卡罗方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 362 17.4 Gibbs 采样. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .365 17.5 不同的峰值之间的混合挑战 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 365 17.5.1 不同峰值之间通过回火来混合 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 367 17.5.2 深度也许会有助于混合 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 368 第 18 章 直面配分函数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 369 18.1 对数似然梯度 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .369 18.2 随机最大似然和对比散度 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 370 18.3 伪似然 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 375 18.4 得分匹配和比率匹配. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .376 18.5 去噪得分匹配 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .378 18.6 噪声对比估计 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .378 18.7 估计配分函数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .380 18.7.1 退火重要采样 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 382 18.7.2 桥式采样 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 384 第 19 章 近似推断 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 385 19.1 把推断视作优化问题. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .385 19.2 期望最大化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 386 19.3 最大后验推断和稀疏编码 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 387 19.4 变分推断和变分学习. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .389 19.4.1 离散型潜变量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 390 19.4.2 变分法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 394 19.4.3 连续型潜变量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 396 19.4.4 学习和推断之间的相互作用 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 397 19.5 学成近似推断 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .397 19.5.1 醒眠算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 398 19.5.2 学成推断的其他形式. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .398 第 20 章 深度生成模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 399 20.1 玻尔兹曼机 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 399 20.2 受限玻尔兹曼机 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 400 20.2.1 条件分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 401 20.2.2 训练受限玻尔兹曼机. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .402 20.3 深度信念网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .402 20.4 深度玻尔兹曼机 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 404 20.4.1 有趣的性质 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 406 20.4.2 DBM 均匀场推断 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 406 20.4.3 DBM 的参数学习 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 408 20.4.4 逐层预训练 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 408 20.4.5 联合训练深度玻尔兹曼机 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 410 20.5 实值数据上的玻尔兹曼机 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 413 20.5.1 Gauss<em>ian</em>-Bernoulli RBM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 413 20.5.2 条件协方差的无向模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 414 20.6 卷积玻尔兹曼机 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 417 20.7 用于结构化或序列输出的玻尔兹曼机 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 418 20.8 其他玻尔兹曼机 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 419 20.9 通过随机操作的反向传播 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 419 20.9.1 通过离散随机操作的反向传播 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 420 20.10 有向生成网络. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .422 20.10.1 sigmoid 信念网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 422 20.10.2 可微生成器网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .423 20.10.3 变分自编码器 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .425 20.10.4 生成式对抗网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .427 20.10.5 生成矩匹配网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .429 20.10.6 卷积生成网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .430 20.10.7 自回归网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 430 20.10.8 线性自回归网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .430 20.10.9 神经自回归网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .431 20.10.10 NADE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 432 20.11 从自编码器采样 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 433 20.11.1 与任意去噪自编码器相关的马尔可夫链 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 434 20.11.2 夹合与条件采样 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .434 20.11.3 回退训练过程 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .435 20.12 生成随机网络. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .435 20.12.1 判别性 GSN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 436 20.13 其他生成方案. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .436 20.14 评估生成模型. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .437 20.15 结论 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 438 参考文献. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .439 索引 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 486
AI深度学习圣经 deep learning全英文版 无水印带书签 完整版
这本书对各类读者都有一定用处,但我们主要是为两类受众对象而写的。其中 一类受众对象是学习机器学习的大学生(本科或研究生),包括那些已经开始职业 生涯的<em>深度学习</em>和人工智能研究者。另一类受众对象是没有机器学习或统计背景但 希望能快速地掌握这方面知识并在他们的产品或平台中使用<em>深度学习</em>的软件工程师。 <em>深度学习</em>在许多软件领域都已被证明是有用的,包括计算机视觉、语音和音频处理、 自然语言处理、机器人技术、生物信息学和化学、电子游戏、搜索引擎、网络广告和 金融 英文原版更能使读者深入了解文章原意,更好的学习<em>深度学习</em>。
Deep Learning - MIT Press: 深度学习 英文.pdf版/mobi/epub电子书
个人认为<em>深度学习</em>之最强教材。近年来<em>深度学习</em>研究者公认课题一网打尽。不仅内容广泛,每个课题的理论背景,公式,实现注意事项等细节都有详细描述。如果要系统掌握<em>深度学习</em>专家们已经确立的方法,这是一本绝好的教科书。 Zip中epub, mobi, pdf有三种格式,kindle, iPad等多种设备上都可以看。
深度学习》(deep learning)PDF扫描版-2017年8月出版
《<em>深度学习</em>》(<em>deep</em> <em>learning</em>)PDF<em>扫描</em>版-2017年8月出版
Deep Learning - Ian Goodfellow 完整高清英文版
Deep Learning - Ian Goodfellow 英文清晰原版,官方网站http://www.<em>deep</em><em>learning</em>book.org/,<em>深度学习</em>经典书籍,包含各种神经网络优化与<em>深度学习</em>领域的最新研究。低分分享,希望可以帮助到大家
Yoshua Bengio新书《Deep Learning》深度学习(中文)学习笔记(improving)
<em>深度学习</em>(中文)学习笔记:
DeepLearning(深度学习中文版)AI圣经
《Deep Learning》<em>中文版</em>(印前版)正式发布。这本书适合于各类读者,尤其是学习机器学习的本科或研究生、<em>深度学习</em>和人工智能的研究者、或没有机器学习与统计背景的软件工程师。 《Deep Learning》这本书是由学界领军人物 Ian Goodfellow、Yoshua Bengio 和 Aaron Courville 合力打造,特斯拉的 CEO 马斯克曾经评价道:《Deep Learning》由领域内三位专家合著,是该领域内唯一的综合性书籍。 这本书的主题具体来说,是机器学习的一种,一种能够使计算 机系统从经验和数据中得到提高的技术。<em>深度学习</em>是一种特定类型的机器学习,具有强大的能力和灵活性,它将大千世界表示为嵌套的层次概念体系(由较简单概念间的联系定义复杂概念、从一般抽象概括到高级抽象表示)。对于本书的结构,第一部分介绍基本的数学工具和机器学习的概念,第二部分介绍最成熟的<em>深度学习</em>算法,而第三部分讨论某些具有展望性的想法,它们被广泛地认为是<em>深度学习</em>未来的研究重点。 因此,本书从基础数学知识到各类深度方法全面而又深入地描述了深度 学习的各个主题。译者们也相信开源此书 PDF 版的中文译文可以促进大家对<em>深度学习</em>的基 础和前沿知识有进一步的理解,也相信通过开放高质量的专业书籍能做到先阅读后付费。
DeepLearning中文版经典 (Ian Goodfellow, Yoshua Bengio, Aaron Courville)
<em>深度学习</em>经典书籍 Ian Goodfellow Yoshua Bengio Aaron Courville 译者: 赵申剑 , 黎彧君 , 符天凡 , 李凯 责编: 王峰松
DeepLearning-Lan Goodfellow 深度学习-赵申剑译
<em>深度学习</em> pdf 文字版,带书签整合版,文件太大,压缩了一下。 作者: 【美】Ian Goodfellow(伊恩·古德费洛) , 【加】Yoshua Bengio(约书亚·本吉奥) , 【加】Aaron Courville(亚伦·库维尔) 译者: 赵申剑 , 黎彧君 , 李凯 , 符天凡
深度学习圣经“花书”Deep Learning公开中文版免费下载
原作者将书在网上公开了的,志愿者翻译成中文。下面的GitHub主页。nnhttps://github.com/exacity/<em>deep</em><em>learning</em>book-chinese/releasesnnGithub<em>下载</em>东西太慢了,这里分享我<em>下载</em>后上传的百度网盘链接(文件大小30M左右)。提取码: rctg 。nn个人评价:本人买了本纸质书,定价十分感人:169RMB。阅读本书需要极有耐心,并且需要大学的...
deep learning 深度学习中文版+英文版 高清 pdf
<em>deep</em> <em>learning</em> <em>深度学习</em><em>中文版</em>+英文版 pdf,包含2本高清pdf
深度学习,人工智能算法,机器学习奠基之作,AI圣经.pdf
AI<em>圣经</em>!<em>深度学习</em>领域奠基性的经典畅销书!长期位居美国亚马逊AI和机器学习类图书榜首!所有数据科学家和机器学习从业者的必读图书!特斯拉CEO埃隆·马斯克等国内外众多专家推荐! <em>深度学习</em>是机器学习的一个分支,它能够使计算机通过层次概念来学习经验和理解世界。因为计算机能够从经验中获取知识,所以不需要人类来形式化地定义计算机需要的所有知识。层次概念允许计算机通过构造简单的概念来学习复杂的概念,而这些分层的图结构将具有很深的层次。本书会介绍<em>深度学习</em>领域的许多主题。 本书囊括了数学及相关概念的背景知识,包括线性代数、概率论、信息论、数值优化以及机器学习中的相关内容。同时,它还介绍了工业界中实践者用到的<em>深度学习</em>技术,包括深度前馈网络、正则化、优化算法、卷积网络、序列建模和实践方法等,并且调研了诸如自然语言处理、语音识别、计算机视觉、在线推荐系统、生物信息学以及视频游戏方面的应用。*后,本书还提供了一些研究方向,涵盖的理论主题包括线性因子模型、自编码器、表示学习、结构化概率模型、蒙特卡罗方法、配分函数、近似推断以及深度生成模型。 《<em>深度学习</em>》这本书既可以被本科生或研究生用于规划其学术界或工业界生涯,也适用于希望在各种产品或平台上开始使用<em>深度学习</em>技术的软件工程师。作者 在本书的配套网站上为读者和教师提供了补充资料。<em>中文版</em>读者可以访问人民邮电出版社异步社区www.epubit.com.cn获取相关信息。 封面特色: 由艺术家Daniel Ambrosi提供的中央公园杜鹃花步道梦幻景观。在Ambrosi的亿级像素全景图上,应用Joseph Smarr(Google)和Chirs Lamb(NVIDIA)修改后的Google DeepDream开源程序,创造了Daniel Ambrosi的“幻景”。 《<em>深度学习</em>》由全球知名的三位专家Ian Goodfellow、Yoshua Bengio 和Aaron Courville撰写,是<em>深度学习</em>领域奠基性的经典教材。全书的内容包括3个部分:第1部分介绍基本的数学工具和机器学习的概念,它们是<em>深度学习</em>的预备知识;第2部分系统深入地讲解现今已成熟的<em>深度学习</em>方法和技术;第3部分讨论某些具有前瞻性的方向和想法,它们被公认为是<em>深度学习</em>未来的研究重点。, 《<em>深度学习</em>》适合各类读者阅读,包括相关专业的大学生或研究生,以及不具有机器学习或统计背景、但是想要快速补充<em>深度学习</em>知识,以便在实际产品或平台中应用的软件工程师。
deep learning中文版(美 Ian Goodfellow 加 Yoshua,Bengio 机器学习开山之作)
《<em>深度学习</em>》由全球知名的三位专家IanGoodfellow、YoshuaBengio和AaronCourville撰写,是<em>深度学习</em>领域奠基性的经典教材。全书的内容包括3个部分:第1部分介绍基本的数学工具和机器学习的概念,它们是<em>深度学习</em>的预备知识;第2部分系统深入地讲解现今已成熟的<em>深度学习</em>方法和技术;第3部分讨论某些具有前瞻性的方向和想法,它们被公认为是<em>深度学习</em>未来的研究重点。
深度学习 epub版,适用于kindle
《<em>深度学习</em>》由全球知名的三位专家Ian Goodfellow、Yoshua Bengio 和Aaron Courville撰写,是<em>深度学习</em>领域奠基性的经典教材。全书的内容包括3个部分:第1部分介绍基本的数学工具和机器学习的概念,它们是<em>深度学习</em>的预备知识;第2部分系统深入地讲解现今已成熟的<em>深度学习</em>方法和技术;第3部分讨论某些具有前瞻性的方向和想法,它们被公认为是<em>深度学习</em>未来的研究重点。 [1] 《<em>深度学习</em>》适合各类读者阅读,包括相关专业的大学生或研究生,以及不具有机器学习或统计背景、但是想要快速补充<em>深度学习</em>知识,以便在实际产品或平台中应用的软件工程师。
深度学习圣经
Ian Goodfellow, Yoshua Bengio ,Aaron Courville的Deep Learning<em>中文版</em>,PDF非<em>扫描</em>,方便复制粘贴
《Deep Learning》Yoshua Bengio即将出版的深度学习书PDF整理
根据11-18版本整理,对上一个整理版本的更新。
深度学习+AI圣经-中文完整版
《Deep Learning》(<em>深度学习</em>)是一本皆在帮助学生和从业人员进入机器学习领域的教科书,以开源的形式免费在网络上提供,这本书是由学界领军人物 Ian Goodfellow、Yoshua Bengio 和 Aaron Courville 合力打造。电子版仅供预览及学习交流使用,<em>下载</em>后请24小时内删除,支持正版,喜欢的请购买正版书籍。
Grokking Deep Learning - 最新版-无水印-有目录-非扫描
一本绝佳的<em>深度学习</em>入门书!CSDN不能免费所以就要一个币了,物超所值!书名直译,就叫《与<em>深度学习</em>神交》吧。虽是新书,但作者并非无名之辈,而且不论是GitHub,还是Twitter,都纷纷点赞这本新教材。更重要的是,这还是一本入门教材。作者说,这本书写了近3年,边写边接受反馈,同时还有配套的手把手实操指南。作者自序:只要有高中数学基础、有点编程经验——比如Python和numpy,你就可以开始学习进阶了。之所以这么做,一是希望任何感兴趣<em>深度学习</em>的人,都能通过这本书认识<em>深度学习</em>,不会被枯燥的高等数学和复杂代码吓倒。另一方面也是希望真正想从事AI的人,哪怕只有高中数学基础,或者懂一点编程,都能从第一章开始,不断升级进阶,最后掌握<em>深度学习</em>的原理、应用和实操。总之,希望<em>深度学习</em>、AI,都能成为人人可用的工具。
深度学习.mobi
《<em>深度学习</em>》一书由Ian Goodfellow / Yoshua Bengio所著,人民邮电出版社出版发行。
深度学习Deep Learning 》中文版 高清完整PDF版带目录
本书包括3 个部分:第1 部分介绍基本的数学工具和机器学习的概念,它们是<em>深度学习</em>的预备知识;第2 部分系统深入地讲解现今已成熟的<em>深度学习</em>方法和技术;第3 部分讨论某些具有前瞻性的方向和想法,它们被公认为是<em>深度学习</em>未来的研究重点。 本书适合各类读者阅读,包括相关专业的大学生或研究生,以及不具有机器学习或统计背景、但是想要快速补充<em>深度学习</em>知识,以便在实际产品或平台中应用的软件工程师。 目录 第1部分 应用数学与机器学习基础 第2章 线性代数 第3章 概率与信息论 第4章 数值计算 第5章 机器学习基础 第2部分 深层网络:现代实践 第6章 深度前馈网络 第7章 <em>深度学习</em>中的正则化 第8章 深度模型中的优化 第9章 卷积网络 第10章 序列建模:循环和递归网络 第11章 实践方法论 第12章 应用 第3部分 <em>深度学习</em>研究 第13章 线性因子模型 第14章 自编码器 第15章 表示学习 第16章 <em>深度学习</em>中的结构化概率模型 第17章 蒙特卡罗方法 第18章 直面配分函数 第19章 近似推断 第20章 深度生成模型
深度学习 [deep learning] AI圣经 Deep Learning 英文版 (花书)
<em>深度学习</em> [<em>deep</em> <em>learning</em>] AI<em>圣经</em> Deep Learning 英文版 ( 花书 ) ,[美] Ian,Goodfellow,[加] Yoshua,Bengio,[加] Aaron ... 著
异步赠书:AI专栏(AI圣经!《深度学习中文版
最新活动:邀请10名好友关注微信公众号“异步图书”,10天,即可获得异步图书一本。nn点击立即参与活动nn nn今天小编开启了大咖重磅新书赠送活动,如果你热爱读书、热爱技术,参与到异步赠书活动中来,都有机会得到新书中的一本哦~~nn本次活动已结束,没有抢到《<em>深度学习</em><em>中文版</em>》的读者,还可以到异步社区最新送书活动:&quot;异步社区两周年庆,豪送20本书&quot;猛击下方地址,共计1000多种IT图书免费任你选,人工...
Deep LearningNov 18 2016 by Ian Goodfellow and Yoshua Bengio(英文版)
(英文版)《Deep Learning》(<em>深度学习</em>)由机器学习领军人物 Ian Goodfellow、Yoshua Bengio 和 Aaron Courville联合编写。<em>深度学习</em>是机器学习中一个非常接近AI的领域,其动机在于建立、模拟人脑进行分析学习的神经网络。将大千世界表示为嵌套的层次概念体系(由较简单概念间的联系定义复杂概念、从一般抽象概括到高级抽象表示)。对于本书的结构,第一部分介绍基本的数学工具和机器学习的概念,第二部分介绍最成熟的<em>深度学习</em>算法,而第三部分讨论某些具有展望性的想法,它们被广泛地认为是<em>深度学习</em>未来的研究重点。
深度学习 AI圣经 PDF【完整版】
<em>深度学习</em> AI<em>圣经</em> PDF【完整版】<em>深度学习</em> AI<em>圣经</em> PDF【完整版】<em>深度学习</em> AI<em>圣经</em> PDF【完整版】<em>深度学习</em> AI<em>圣经</em> PDF【完整版】
深度学习Deep Learning with Python 》2017 高清完整PDF版 A Hands-on Introduction
Deep Learning with Python: A Hands-on Introduction , 作者: Nikhil Ketkar
深度学习 人工智能算法,机器学习奠基之作,AI圣经 扫描版[PDF] 带标签
AI<em>圣经</em> Deep Learning<em>中文版</em> 长期位居美国ya马逊人工智能和机器学习类图书榜首 <em>深度学习</em>领域奠基性的经典畅销书 特斯拉CEO埃隆·马斯克等国内外众多专家推荐 内容介绍: 《<em>深度学习</em>》由全球知名的三位专家IanGoodfellow、YoshuaBengio和AaronCourville撰写,是<em>深度学习</em>领域奠基性的经典教材。全书的内容包括3个部分:第1部分介绍基本的数学工具和机器学习的概念,它们是<em>深度学习</em>的预备知识;第2部分系统深入地讲解现今已成熟的<em>深度学习</em>方法和技术;第3部分讨论某些具有前瞻性的方向和想法,它们被公认为是<em>深度学习</em>未来的研究重点。
深度学习 [deep learning] AI圣经 Deep Learning中文文字版 去水印去广告 目录完整版
AI<em>圣经</em> Deep Learning<em>中文版</em> 长期位居美国ya马逊人工智能和机器学习类图书榜首 <em>深度学习</em>领域奠基性的经典畅销书 特斯拉CEO埃隆·马斯克等国内外众多专家推荐 https://item.jd.com/12128543.html
Deep Learning.pdf Ian Goodfellow Yoshua Bengio Aaron Courville
802页,不错的电子书,内容全面,推荐给大家使用,有关<em>深度学习</em>的。英文版
Deep Learning by Ian Goodfellow, Yoshua Bengio, Aaron Courville
Deep Learning text book by Ian Goodfellow etc. English version
深度学习》PDF超清中文完整版,深度学习圣经,花书
《<em>深度学习</em>》PDF超清中文完整版,被称为<em>深度学习</em><em>圣经</em>,俗称花书,由<em>深度学习</em>界3大巨头合力编写,是<em>深度学习</em>从业者每人都应该拜读的经典之作!
深度学习Ai圣经中文完整版pdf
《<em>深度学习</em>》由全球知名的三位专家IanGoodfellow、YoshuaBengio和AaronCourville撰写,是<em>深度学习</em>领域奠基性的经典教材。全书的内容包括3个部分:第1部分介绍基本的数学工具和机器学习的概念,它们是<em>深度学习</em>的预备知识;第2部分系统深入地讲解现今已成熟的<em>深度学习</em>方法和技术;第3部分讨论某些具有前瞻性的方向和想法,它们被公认为是<em>深度学习</em>未来的研究重点。   《<em>深度学习</em>》适合各类读者阅读,包括相关专业的大学生或研究生,以及不具有机器学习或统计背景、但是想要快速补充<em>深度学习</em>知识,以便在实际产品或平台中应用的软件工程师。
深度学习(Ian Goodfellow Yoshua Bengio编著)
本书<em>深度学习</em>,由Ian Goodfellow Yoshua Bengio编著,可供大数据,AI工程师参阅与指导
深度学习 AI圣经 中文版pdf下载 最新版本
<em>深度学习</em> AI<em>圣经</em> 中文最新修正版本 不是样章,就对可以查看完整章节,<em>下载</em>后好用给好评呀,谢了。
深度学习 中文版 【Mobi格式】
《<em>深度学习</em>》由全球知名的三位专家Ian Goodfellow、Yoshua Bengio 和Aaron Courville撰写,是<em>深度学习</em>领域奠基性的经典教材。全书的内容包括3个部分:第1部分介绍基本的数学工具和机器学习的概念,它们是<em>深度学习</em>的预备知识;第2部分系统深入地讲解现今已成熟的<em>深度学习</em>方法和技术;第3部分讨论某些具有前瞻性的方向和想法,它们被公认为是<em>深度学习</em>未来的研究重点。 《<em>深度学习</em>》适合各类读者阅读,包括相关专业的大学生或研究生,以及不具有机器学习或统计背景、但是想要快速补充<em>深度学习</em>知识,以便在实际产品或平台中应用的软件工程师。
DEEP LEARNING 深度学习 中文高清珍藏版.包含源代码
本资源包含 高清PDF 和源代码 《Deep Learning》(<em>深度学习</em>)是一本皆在帮助学生和从业人员进入机器学习领域的教科书,以开源的形式免费在网络上提供,这本书是由学界领军人物 Ian Goodfellow、Yoshua Bengio 和 Aaron Courville 合力打造。
Deep Learning 深度学习 Yoshua Bengio& Ian GoodFellow中文版
Deep Learning <em>深度学习</em> Yoshua Bengio& Ian GoodFellow<em>中文版</em> 仅用作学习参考,不得用作商业用途
深度学习 MIT press document by Goodfellow and Yoshua Bengio and Aaron Courville
The Deep Learning textbook is a resource intended to help students and practitioners enter the field of machine <em>learning</em> in general and <em>deep</em> <em>learning</em> in particular. Developed on GitHub by Goodfellow and Yoshua Bengio and Aaron Courville
深度学习 AI圣经
转自:<em>deep</em><em>learning</em>book-chinese 英文原版地址:<em>deep</em><em>learning</em>book。GitHub上面的发布版本PDF文件存储在AWSrn S3上面,国内无法<em>下载</em>,因此拷贝了最新版本的放在此处:<em>下载</em>链接
Deep Learning (Yoshua Bengio, Ian Goodfellow, Aaron Courville, October 03, 2015)
机器学习大牛Bengio等人最近出的关于<em>深度学习</em>的书,对于人工智能和<em>深度学习</em>的研究者有很大帮助。
Yoshua Bengio《Deep Learning》
最新<em>deep</em> <em>learning</em> 教程 ,最全面的知识讲解。 AI<em>圣经</em>!<em>深度学习</em>领域奠基性的经典畅销书!
deep learning(Ian Goodfellow 中文版
<em>deep</em> <em>learning</em>(Ian Goodfellow <em>中文版</em>),7月最新版,官方网站http://www.<em>deep</em><em>learning</em>book.org/,<em>深度学习</em>好书,包含各种神经网络优化与<em>深度学习</em>领域的最新研究
深度学习圣经中文版pdf(带书签)
<em>深度学习</em>书籍<em>中文版</em> 作者 lan Goodfellow等,号称人工智能<em>深度学习</em>的<em>圣经</em>
Goodfellow、Bengio《Deep Learning》 中文版
Ian Goodfellow、Yoshua Bengio和Aaron Courville合著的<em>深度学习</em>经典图书《Deep Learning》中文翻译版
深度学习中文版)(AI圣经
高清,无水印,带目录 AI<em>圣经</em> Deep Learning<em>中文版</em> [美]Ian Goodfellow(伊恩·古德费洛)
Deep Learning Ian Goodfellow Yoshua Bengio Aaron Courville 中文版
Deep Learning Ian Goodfellow Yoshua Bengio Aaron Courville <em>中文版</em>
Neural Networks and Deep Learning-神经网络与深度学习(中英文两个版本)
Neural Network and Deep Learning 神经网络与<em>深度学习</em><em>中文版</em>和英文版两个版本,可以两个一起参考使用,<em>深度学习</em>不错的入门书籍
hcf4511英文资料下载
详细介绍hcf4511的资料 pdf格式 非常有用哦 相关下载链接:[url=//download.csdn.net/download/michaeltuo111/2236399?utm_source=bbsseo]//download.csdn.net/download/michaeltuo111/2236399?utm_source=bbsseo[/url]
QT paint 画笔程序,对画笔的一些简单设置下载
这个程序主要是用QT对画笔进行一个简单设置,大家可以看看那 相关下载链接:[url=//download.csdn.net/download/quanzhizu200511/2750578?utm_source=bbsseo]//download.csdn.net/download/quanzhizu200511/2750578?utm_source=bbsseo[/url]
Hibernate资料下载
Hibernate基础入门相关参考资料。 相关下载链接:[url=//download.csdn.net/download/isobelar/2763604?utm_source=bbsseo]//download.csdn.net/download/isobelar/2763604?utm_source=bbsseo[/url]
文章热词 机器学习教程 Objective-C培训 交互设计视频教程 颜色模型 设计制作学习
相关热词 mysql关联查询两次本表 native底部 react extjs glyph 图标 圣经学习软件ios版 深度学习教程中文版
我们是很有底线的