深度学习核心技术与实践
  • 推荐5
  • 收藏8
  • 浏览3.0K

深度学习核心技术与实践

邓澍军 (作者) 

  • 书  号:978-7-121-32905-0
  • 出版日期:2018-02-09
  • 页  数:528
  • 开  本:16(185*235)
  • 出版状态:上市销售
  • 维护人:张春雨
电子书 ¥79.00
购买电子书
纸质版 ¥119.00
本书主要介绍深度学习的核心算法,以及在计算机视觉、语音识别、自然语言处理中的相关应用。本书的作者们都是业界第一线的深度学习从业者,所以书中所写内容和业界联系紧密,所涵盖的深度学习相关知识点比较全面。本书主要讲解原理,较少贴代码。
本书适合深度学习从业人士或者相关研究生作为参考资料,也可以作为入门教程来大致了解深度学习的相关前沿技术。
融汇Ml|DL核心算法 贯通计算机视觉|语音识别|自然语言处理应用
前言
本书的大部分作者在深度学习流行之前有幸从事机器学习相关工作多年。在我们内部,
一直认同一个段子:有多少人工就有多少智能。
? 在深度学习流行之前的传统机器学习年代,我们认为“人工”更多强调的是特征工程
之难,需要机器学习从业者不断分析数据,挖掘新的特征。
? 在深度学习流行的这几年,我们认为这句话依然成立,只是“人工”更多地强调人工
标注,因为深度学习需要大量的标注数据。当然,也有人反驳说不需要标注,用户的
使用历史天然就是标注。实际上,这可以理解为一种众筹标注。
? 在深度学习发展的未来,我们希望这句话不再成立,期待无监督模型取得更长足的进
步,使得“人工”智能变为真正的智能。
在追求智能的路上,我们虽然是创业公司,但一直坚持机器学习相关课程的学习和Paper
Reading,陆续学习了传统的机器学习相关算法,也探索了深度学习的相关原理,并不断应用
到实践中。
受益于当今学术开放开源的氛围,深度学习的最新算法甚至代码实践大家都能在第一
时间进行学习。所以在创业公司的早期深度学习实践中,最重要的并不是算法理论方面的创
新,而是结合产品需求如何进行深度学习技术的落地。这需要团队不仅对业务非常熟悉,也
需要对深度学习相关算法了如指掌,同时还需要有人可以将算法真正用代码落地。很幸运,
我们的团队具备这样的能力,所以在深度学习的实践中较少走弯路。随着多年的积累,团队
在深度学习方面开始有不少自己的创新,也对理论有了整体的认识。从2016 年下半年开始,
团队部分成员利用周末等业余时间撰写了这本书,算是对团队过去所学深度学习知识的一个
总结。本书的撰写都是大家牺牲周末时间完成的,且在撰写过程中,碰到多次项目进度非常
紧急的情况,周末时间也被项目占用,但大家还是克服困难,完成了书稿,非常感谢这些作
者的配合!此外,猿辅导研究团队的大部分成员参与了审稿相关工作,在此一并表示感谢!
当然,本书撰写较仓促,作者人数也较多,错误和不足在所难免,烦请读者及时反馈,
我们将及时纠正。
在这个过程中,有了一点点微不足道的积累。希望通过本书,对过去学过的知识做一些
总结归纳,同时分享出来让更多的深度学习爱好者一起受益。
写作分工
朱珊珊编写了第1 章的1.2.1 节主要部分、1.3 节,第2 章的绝大部分内容,第13 章。
邓澍军编写了前言,第1 章的1.1 节、1.2.2 节至1.2.4 节,第2 章的2.2.2 节、2.2.6 节至
2.2.8 节,第3 章,第6 章的6.1 节、6.2 节,第7 章,第8 章的8.1 节,第9 章,第10 章的
10.6 节、10.7 节,第11、17、18、21 章,第25 章的25.3 节。
陈孟阳编写了第4、10 章。
孙萌编写了第5、22 章。
冯超编写了第6 章的6.3 节至6.10 节,第8 章的8.3 节、8.5 节至8.7 节,第27、28 章。
曹月恬编写了第8 章的8.2 节、8.4 节,第24 章。
杨晓庆编写了第12、26 章。
夏龙编写了第14、15 章,第16 章的16.1 节、16.2 节、16.5 节、16.6 节。
吴凡编写了第16 章的16.3 节、16.4 节。
赵薇编写了第19 章。
陈冬晓编写了第20 章。
赵玲玲编写了第23 章。
王锐坚编写了第25 章。
本书特点
本书首先介绍了深度学习的一些基本原理,然后介绍了计算机视觉、语音识别、自然语
言处理的相关应用,最后介绍了一些较前沿的研究方向。
本书具有如下特点:
? 计算机视觉、语音识别、自然语言处理这三方面的介绍内容绝大部分是作者团队有过
相关实践和研究的方向,和业界联系紧密。
? 所涵盖的深度学习相关知识点比较全面。
? 干货:主要讲解原理,较少贴代码。
本书的篇章脉络如下:
本书读者
本书适合深度学习从业人士或者相关研究生作为参考资料,也可以作为入门教程大致了
解深度学习的相关前沿技术。
关于团队
猿辅导研究团队成立于2014 年,是创业公司中较早从事深度学习的团队。该团队陆续
将深度学习应用于如下领域:
? 拍照印刷体OCR(Optical Character Recognition,光学字符识别):从0 开始打造拍照
搜题APP 小猿搜题(目前累计安装量达1.6 亿次)。
? 拍照手写体OCR:包括斑马速算产品中的屏幕手写笔迹的在线手写识别、拍照手写
图片的离线手写识别、与公务员考试相关的申论手写识别等。
? 语音识别:包括古诗词背诵、高考听说自动判卷、英语口语打分等项目。
? 自然语言处理:主要应用于英语作文自动批改、自动判卷、短文本对话等项目。
关于公司
猿辅导公司是中国领先的移动在线教育机构,拥有中国最多的中学生移动用户,以及
国内最大的中学生练习行为数据库,旗下有猿题库、小猿搜题、猿辅导三款移动教育APP。
2017 年6 月猿辅导获得由华平投资集团领投、腾讯跟投的1.2 亿美元E 轮融资,估值超过10
亿美元,成为国内K-12 在线教育领域首个独角兽公司。

目录

目录
第1 部分深度学习基础篇1
1 概述2
1.1 人工智能. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.1.1 人工智能的分类. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.1.2 人工智能发展史. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 机器学习. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2.1 机器学习的由来. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2.2 机器学习发展史. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.2.3 机器学习方法分类. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.2.4 机器学习中的基本概念. . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.3 神经网络. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.3.1 神经网络发展史. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
参考文献. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2 神经网络17
2.1 在神经科学中对生物神经元的研究. . . . . . . . . . . . . . . . . . . . . . . . . 17
2.1.1 神经元激活机制. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.1.2 神经元的特点. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.2 神经元模型. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.2.1 线性神经元. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.2.2 线性阈值神经元. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.2.3 Sigmoid 神经元. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.2.4 Tanh 神经元. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.2.5 ReLU . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.2.6 Maxout . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.2.7 Softmax . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.2.8 小结. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.3 感知机. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.3.1 感知机的提出. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.3.2 感知机的困境. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.4 DNN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.4.1 输入层、输出层及隐层. . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.4.2 目标函数的选取. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.4.3 前向传播. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.4.4 后向传播. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.4.5 参数更新. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.4.6 神经网络的训练步骤. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
参考文献. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3 初始化模型38
3.1 受限玻尔兹曼机. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.1.1 能量模型. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.1.2 带隐藏单元的能量模型. . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.1.3 受限玻尔兹曼机基本原理. . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.1.4 二值RBM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.1.5 对比散度. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.2 自动编码器. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.2.1 稀疏自动编码器. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
3.2.2 降噪自动编码器. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
3.2.3 栈式自动编码器. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.3 深度信念网络. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
参考文献. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
4 卷积神经网络53
4.1 卷积算子. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
4.2 卷积的特征. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
4.3 卷积网络典型结构. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
4.3.1 基本网络结构. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
4.3.2 构成卷积神经网络的层. . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
4.3.3 网络结构模式. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
4.4 卷积网络的层. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
4.4.1 卷积层. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
4.4.2 池化层. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
参考文献. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
5 循环神经网络68
5.1 循环神经网络简介. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
5.2 RNN、LSTM 和GRU . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
5.3 双向RNN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
5.4 RNN 语言模型的简单实现. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
参考文献. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
6 深度学习优化算法81
6.1 SGD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
6.2 Momentum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
6.3 NAG . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
6.4 Adagrad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
6.5 RMSProp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
6.6 Adadelta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
6.7 Adam . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
6.8 AdaMax . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
6.9 Nadam . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
6.10 关于优化算法的使用. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
参考文献. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
7 深度学习训练技巧94
7.1 数据预处理. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
7.2 权重初始化. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
7.3 正则化. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
7.3.1 提前终止. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
7.3.2 数据增强. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
7.3.3 L2/L1 参数正则化. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
7.3.4 集成. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
7.3.5 Dropout . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
参考文献. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
8 深度学习框架103
8.1 Theano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
8.1.1 Theano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
8.1.2 安装. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
8.1.3 计算图. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
8.2 Torch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
8.2.1 概述. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
8.2.2 安装. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
8.2.3 核心结构. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
8.2.4 小试牛刀. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
8.3 PyTorch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
8.3.1 概述. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
8.3.2 安装. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
8.3.3 核心结构. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
8.3.4 小试牛刀. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
8.4 Caffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
8.4.1 概述. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
8.4.2 安装. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
8.4.3 核心组件. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
8.4.4 小试牛刀. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
8.5 TensorFlow . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
8.5.1 概述. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
8.5.2 安装. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
8.5.3 核心结构. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
8.5.4 小试牛刀. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
8.6 MXNet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
8.6.1 概述. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
8.6.2 安装. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
8.6.3 核心结构. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
8.6.4 小试牛刀. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
8.7 Keras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
8.7.1 概述. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
8.7.2 安装. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
8.7.3 模块介绍. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
8.7.4 小试牛刀. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
参考文献. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
第2 部分计算机视觉篇140
9 计算机视觉背景141
9.1 传统计算机视觉. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
9.2 基于深度学习的计算机视觉. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
9.3 参考文献. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
10 图像分类模型147
10.1 LeNet-5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
10.2 AlexNet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
10.3 VGGNet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
10.3.1 网络结构. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
10.3.2 配置. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
10.3.3 讨论. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
10.3.4 几组实验. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158
10.4 GoogLeNet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
10.4.1 NIN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
10.4.2 GoogLeNet 的动机. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
10.4.3 网络结构细节. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162
10.4.4 训练方法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
10.4.5 后续改进版本. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
10.5 ResNet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
10.5.1 基本思想. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
10.5.2 网络结构. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
10.6 DenseNet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
10.7 DPN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170
参考文献. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170
11 目标检测173
11.1 相关研究. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
11.1.1 选择性搜索. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
11.1.2 OverFeat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177
11.2 基于区域提名的方法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179
11.2.1 R-CNN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179
11.2.2 SPP-net . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
11.2.3 Fast R-CNN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182
11.2.4 Faster R-CNN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184
11.2.5 R-FCN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185
11.3 端到端的方法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186
11.3.1 YOLO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186
11.3.2 SSD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187
11.4 小结. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188
参考文献. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190
12 语义分割192
12.1 全卷积网络. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193
12.1.1 FCN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193
12.1.2 DeconvNet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195
12.1.3 SegNet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197
12.1.4 DilatedConvNet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198
12.2 CRF/MRF 的使用. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199
12.2.1 DeepLab . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199
12.2.2 CRFasRNN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201
12.2.3 DPN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203
12.3 实例分割. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205
12.3.1 Mask R-CNN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205
参考文献. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206
13 图像检索的深度哈希编码208
13.1 传统哈希编码方法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208
13.2 CNNH . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209
13.3 DSH . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 210
13.4 小结. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212
参考文献. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212
第3 部分语音识别篇214
14 传统语音识别基础215
14.1 语音识别简介. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215
14.2 HMM 简介. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 216
14.2.1 HMM 是特殊的混合模型. . . . . . . . . . . . . . . . . . . . . . . . . . . 218
14.2.2 转移概率矩阵. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219
14.2.3 发射概率. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 220
14.2.4 Baum-Welch 算法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 220
14.2.5 后验概率. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224
14.2.6 前向-后向算法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224
14.3 HMM 梯度求解. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227
14.3.1 梯度算法1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 228
14.3.2 梯度算法2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230
14.3.3 梯度求解的重要性. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234
14.4 孤立词识别. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234
14.4.1 特征提取. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234
14.4.2 孤立词建模. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 235
14.4.3 GMM-HMM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237
14.5 连续语音识别. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 240
14.6 Viterbi 解码. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243
14.7 三音素状态聚类. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245
14.8 判别式训练. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 248
参考文献. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254
15 基于WFST 的语音解码256
15.1 有限状态机. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 257
15.2 WFST 及半环定义. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 257
15.2.1 WFST . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 257
15.2.2 半环(Semiring) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 258
15.3 自动机操作. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 260
15.3.1 自动机基本操作. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 261
15.3.2 转换器基本操作. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262
15.3.3 优化操作. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 265
15.4 基于WFST 的语音识别系统. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 277
15.4.1 声学模型WFST . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 279
15.4.2 三音素WFST . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 281
15.4.3 发音字典WFST . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 281
15.4.4 语言模型WFST . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 282
15.4.5 WFST 组合和优化. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 284
15.4.6 组合和优化实验. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 285
15.4.7 WFST 解码. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 286
参考文献. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287
16 深度语音识别288
16.1 CD-DNN-HMM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 288
16.2 TDNN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 292
16.3 CTC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 295
16.4 EESEN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 299
16.5 Deep Speech . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 301
16.6 Chain . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 310
参考文献. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 313
17 CTC 解码315
17.1 序列标注. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 315
17.2 序列标注任务的解决办法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 316
17.2.1 序列分类. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 316
17.2.2 分割分类. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 317
17.2.3 时序分类. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 318
17.3 隐马模型. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 318
17.4 CTC 基本定义. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 319
17.5 CTC 前向算法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 321
17.6 CTC 后向算法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 324
17.7 CTC 目标函数. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 325
17.8 CTC 解码基本原理. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 327
17.8.1 最大概率路径解码. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 327
17.8.2 前缀搜索解码. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 328
17.8.3 约束解码. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 329
参考文献. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333
第4 部分自然语言处理篇334
18 自然语言处理简介335
18.1 NLP 的难点. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 335
18.2 NLP 的研究范围. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 336
19 词性标注338
19.1 传统词性标注模型. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 338
19.2 基于神经网络的词性标注模型. . . . . . . . . . . . . . . . . . . . . . . . . . . . 340
19.3 基于Bi-LSTM 的神经网络词性标注模型. . . . . . . . . . . . . . . . . . . . . . 342
参考文献. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 344
20 依存句法分析345
20.1 背景. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 346
20.2 SyntaxNet 技术要点. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 348
20.2.1 Transition-based 系统. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 349
20.2.2 “模板化” 技术. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 353
20.2.3 Beam Search . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 355
参考文献. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 357
21 word2vec 358
21.1 背景. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 359
21.1.1 词向量. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 359
21.1.2 统计语言模型. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 359
21.1.3 神经网络语言模型. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 362
21.1.4 Log-linear 模型. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 364
21.1.5 Log-bilinear 模型. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 365
21.1.6 层次化Log-bilinear 模型. . . . . . . . . . . . . . . . . . . . . . . . . . . 365
21.2 CBOW 模型. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 366
21.3 Skip-gram 模型. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 369
21.4 Hierarchical Softmax 与Negative Sampling . . . . . . . . . . . . . . . . . . . . . . 371
21.5 fastText . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 372
21.6 GloVe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 373
21.7 小结. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 374
参考文献. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 374
22 神经网络机器翻译376
22.1 机器翻译简介. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 376
22.2 神经网络机器翻译基本模型. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 377
22.3 基于Attention 的神经网络机器翻译. . . . . . . . . . . . . . . . . . . . . . . . . 379
22.4 谷歌机器翻译系统GNMT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 381
22.5 基于卷积的机器翻译. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 382
22.6 小结. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 383
参考文献. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 384
第5 部分深度学习研究篇385
23 Batch Normalization 386
23.1 前向与后向传播. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 387
23.1.1 前向传播. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 387
23.1.2 后向传播. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 390
23.2 有效性分析. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 393
23.2.1 内部协移. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 393
23.2.2 梯度流. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 393
23.3 使用与优化方法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 395
23.4 小结. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 396
参考文献. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 396
24 Attention 397
24.1 从简单RNN 到RNN + Attention . . . . . . . . . . . . . . . . . . . . . . . . . . . 398
24.2 Soft Attention 与Hard Attention . . . . . . . . . . . . . . . . . . . . . . . . . . . . 398
24.3 Attention 的应用. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 399
24.4 小结. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 401
参考文献. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 402
25 多任务学习403
25.1 背景. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 403
25.2 什么是多任务学习. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 404
25.3 多任务分类与其他分类概念的关系. . . . . . . . . . . . . . . . . . . . . . . . . 406
25.3.1 二分类. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 406
25.3.2 多分类. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 407
25.3.3 多标签分类. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 407
25.3.4 相关关系. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 408
25.4 多任务学习如何发挥作用. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 409
25.4.1 提高泛化能力的潜在原因. . . . . . . . . . . . . . . . . . . . . . . . . . . 410
25.4.2 多任务学习机制. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 410
25.4.3 后向传播多任务学习如何发现任务是相关的. . . . . . . . . . . . . . . . 412
25.5 多任务学习被广泛应用. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 413
25.5.1 使用未来预测现在. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 413
25.5.2 多种表示和度量. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 413
25.5.3 时间序列预测. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 413
25.5.4 使用不可操作特征. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 414
25.5.5 使用额外任务来聚焦. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 414
25.5.6 有序迁移. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 414
25.5.7 多个任务自然地出现. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 414
25.5.8 将输入变成输出. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 414
25.6 多任务深度学习应用. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 416
25.6.1 脸部特征点检测. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 416
25.6.2 DeepID2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 418
25.6.3 Fast R-CNN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 419
25.6.4 旋转人脸网络. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 420
25.6.5 实例感知语义分割的MNC . . . . . . . . . . . . . . . . . . . . . . . . . . 422
25.7 小结. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 423
参考文献. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 425
26 模型压缩426
26.1 模型压缩的必要性. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 426
26.2 较浅的网络. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 428
26.3 剪枝. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 428
26.4 参数共享. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 434
26.5 紧凑网络. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 437
26.6 二值网络. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 438
26.7 小结. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 442
参考文献. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 442
27 增强学习445
27.1 什么是增强学习. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 445
27.2 增强学习的数学表达形式. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 448
27.2.1 MDP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 449
27.2.2 策略函数. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 450
27.2.3 奖励与回报. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 450
27.2.4 价值函数. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 452
27.2.5 贝尔曼方程. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 453
27.2.6 最优策略性质. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 453
27.3 用动态规划法求解增强学习问题. . . . . . . . . . . . . . . . . . . . . . . . . . . 454
27.3.1 Agent 的目标. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 454
27.3.2 策略评估. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 455
27.3.3 策略改进. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 456
27.3.4 策略迭代. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 457
27.3.5 策略迭代的例子. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 458
27.3.6 价值迭代. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 459
27.3.7 价值迭代的例子. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 461
27.3.8 策略函数和价值函数的关系. . . . . . . . . . . . . . . . . . . . . . . . . 462
27.4 无模型算法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 462
27.4.1 蒙特卡罗法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 463
27.4.2 时序差分法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 465
27.4.3 Q-Learning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 466
27.5 Q-Learning 的例子. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 467
27.6 AlphaGo 原理剖析. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 469
27.6.1 围棋与机器博弈. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 469
27.6.2 Alpha-Beta 树. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 472
27.6.3 MCTS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 473
27.6.4 UCT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 476
27.6.5 AlphaGo 的训练策略. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 478
27.6.6 AlphaGo 的招式搜索算法. . . . . . . . . . . . . . . . . . . . . . . . . . . 482
27.6.7 围棋的对称性. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 484
27.7 AlphaGo Zero . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 484
参考文献. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 484
28 GAN 486
28.1 生成模型. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 486
28.2 生成对抗模型的概念. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 488
28.3 GAN 实战. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 492
28.4 InfoGAN——探寻隐变量的内涵. . . . . . . . . . . . . . . . . . . . . . . . . . . 493
28.5 Image-Image Translation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 496
28.6 WGAN(Wasserstein GAN) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 499
28.6.1 GAN 目标函数的弱点. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 500
28.6.2 Wasserstein 度量的优势. . . . . . . . . . . . . . . . . . . . . . . . . . . . 501
28.6.3 WGAN 的目标函数. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 504
参考文献. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 505
A 本书涉及的开源资源列表 506

本书勘误

印次
  • 页码:89  •  行数:17  •  印次: 1


    参考
    1.加号应为逗号
    2.画线处应为ut或者ut+e

    Autoz 提交于 2019/4/19 16:32:42
    张春雨 确认于 2019/7/11 10:18:28

读者评论

  • 不明白“核心技术与实践”这几个字是怎么印上去的,实战,连一个完整的项目都没有,一堆公式都是到处Copy的吧,猿辅导研究团队就只是研究,不会码代码?连代码都是给开源项目的,开源项目的代码还用你们给?你们还出书干嘛,我们自己看开源代码的文档,教程比你这本烂书有效。垃圾就垃圾,团队早日解散,公司早日倒闭吧。。。。

    tianhualefei发表于 2019/6/6 22:58:23
  • 展示的算法有很多符号错误,需要结合出处勘误,很费时间

    Autoz发表于 2019/4/19 18:38:57
  • 书真的很烂,但还是佩服作者出书的勇气

    sunjifeng11发表于 2018/10/5 10:31:19
  • 建议大家别买了,提到很多知识点,但是几乎没有一个讲清楚的,另外代码资源没有,要自己根据引用论文自己去找,成本太高

    sunjifeng11发表于 2018/10/5 10:30:13
  • 示例代码和资源文件在哪里下载。

    CassieHaiping发表于 2018/6/26 12:36:23
    • 读者你好,这本书里面涉及到的开源代码在附录中给出了资源列表~~谢谢

      夏龙发表于 2018/7/31 11:33:02

下载资源

电子书版本

  • Epub

相关博文

  • 【深度学习丨主题周】人类与计算机的翻译官:词向量

    【深度学习丨主题周】人类与计算机的翻译官:词向量

    管理员账号 2018-03-29

    小编说:词向量是计算机识别自然语言的基础概念,其具体使用方法和场景还有很多,本文简要地介绍了词向量的由来和发展,借此揭开计算机识别自然语言的神秘面纱。本文选自《深度学习核心技术与实践》一书,。 无论是机器翻译,还是智能人工客服,你是...

    管理员账号 2018-03-29
    406 0 0 0

相关图书

实用推荐系统

Kim Falk (作者) 李源 朱罡罡 温睿 (译者)

要构建一个实用的“智能”推荐系统,不仅需要有好的算法,还需要了解接收推荐的用户。本书分为两部分,第一部分侧重于基础架构,主要介绍推荐系统的工作原理,展示如何创建...

¥119.00

集成学习:基础与算法

Zhi-Hua Zhou (作者) 李楠 (译者)

集成学习方法是一类先进的机器学习方法,这类方法训练多个学习器并将它们结合起来解决一个问题,在实践中获得了巨大成功。<br>全书分为三部分。第一部分主要介绍集成学...

¥89.00

Java微服务实战

赵计刚 (作者)

本书分为三部分:基础框架篇(1~6章)、服务框架篇(7~10章)、监控部署篇(11~13章),由浅入深来讲解微服务的相关技术。基础框架篇从微服务架构的基本概念与...

¥39.00

深度学习入门之PyTorch

廖星宇 (作者)

深度学习如今已经成为了科技领域最炙手可热的技术,在本书中,我们将帮助你入门深度学习的领域。本书将从人工智能的介绍入手,了解机器学习和深度学习的基础理论,并学习如...

¥49.00

套路!机器学习:北美数据科学家的私房课

林荟 (作者)

数据科学家目前是北美最热门的职业之一,平均年薪突破10万美元。但数据科学并不是一个低门槛的行业,除了对数学、统计、计算机等相关领域的技术要求以外,还要相关应用领...

¥68.00

用商业案例学R语言数据挖掘

经管之家 (作者)

商业智能时代已经全面到来,分析型人才的岗位数量在就业市场中呈现井喷式增长。无论是从事产品<br>研发的工程师,还是从事产品推广的市场人员、人力资源和财务会计人员...

¥69.00