神经网络与深度学习-图书

推荐0
收藏4
浏览1.7K

神经网络与深度学习

吴岸城 (作者)　郑柳洁 (责任编辑)

书　　号：978-7-121-28869-2
出版日期：2016-06-12
页　　数：232
开　　本：16(170*240)
出版状态：上市销售
维护人：刘皎

纸质版￥59.00

随着大数据和人工智能的发展，深度学习成为时下关注的技术热点。本选题旨在以浅显易懂的方式介绍深度学习的基本理念和技术架构，帮助从事相关工作的人们对深度学习有一个基本全面的认识。包括对神经网络基本原理的介绍、如何构建一个最基础的神经网络模型、深度学习是什么、怎么用？如何用深度学习来解决问题。

神经网络与深度学习算法入门书

很多朋友告诉我，一本书总是要加一个前言才算完整。如果书没有前言，就好像只有山没有水一样，没有意境。
对我来说，这是我的第一本技术科普类读物。之所以把它称作第一本，是因为我从前没写过书，哪怕是一篇超过4万字的文章（论文不算）都没写过，所以听编辑说写书有字数要求时，我都没有概念，心想不就写本书吗？easy！
写着写着发现不对了，自己没有为一本书建立好整体知识体系！从2014年开始断断续续地写着，中间有段时间甚至想过放弃。我之所以没放弃，无非是因为觉得做事要有始有终。如果我写得不好，那是我的能力有限；如果因为一些之前估计不到的难度就放弃了，那是态度问题！
为什么说这是一本科普类读物呢？至少在我写书时，很多人（都是IT、软件这个行业的人）对于神经网络、深度学习（Deep Learning）等都毫无概念，如果连这些人对神经网络等都没有概念，可以想象其普及程度有多低。但我觉得深度学习并不是只有大学学府或几个相关的专业学生才能研究它；并不是只有公司里这个领域的专家才能研究它，它是属于整个大众的东西。
对于技术层面的东西，将会慢慢简化再简化，如同编程语言一样，开始是汇编语言，后来是C语言，再后来有了C++，再后来有了Java，甚至出现了Python、JavaScript，它们降低了进入门槛，可以让更多人使用。对的，编程语言的进化就是让更多人更便捷地使用。对于深度学习来说，基本的算法库至少目前来讲已经很多很多了，这些算法库基本覆盖了我们的现代编程语言，让人能够更方便地使用。微软甚至出了一个图形化的深度学习在线工具，你只要拖曳下鼠标就能得到一个算法并训练它，极大地加快了学习效率。
我强调这一点是想说：技术的进步扩散了这些技术，最终目标也许就是机器像人类那样思考，让人类想什么有什么，而不仅仅局限于技术层面；而今天深度学习的进化已经可以使机器通过学习已有的知识就能推导出或预测出未知的事物，想起这点时常让我激动，让我觉得创造出一个机器生命体是有可能的！所以写本书的意义在于让人们不过多地关注公式及推导过程，而是关注它的使用方法，把人类的想法迅速转换成生产力才是目的，毕竟只有人类的想法才是最有价值的！
按以上思路，我安排书的整体目录架构如下。
第0章，介绍机器学习、神经网络的历史，好让大家有基本的了解。
第1章，解释大脑的运作结构和如何利用仿生学产生逻辑上的神经元和神经网络。
第2章，我们用仿生学的知识试着构造一个神经网络（感知机）并使用它做些事情，解释了XOR问题。在2.6节给出一些例子，让我们能更好地了解神经网络是如何分类学习和预测的。
第3章，介绍深度学习的基本概念，深度学习和神经网络的联系。
第4章，介绍深度学习的常用方法。
第5章，介绍AlphaGo。
第6章，两个重要概念，迁移学习和概率图模型PGM。
第7章，给出了一些经验以加快大家学习和研究的效率。
按照惯例，在前言的最后一部分应该做一些感谢，首先要感谢张杰同学，是他介绍了我和电子工业出版社的编辑认识。感谢我的编辑刘皎，对于一个刚刚进入写书圈子的新人，她给予了我很多帮助和支持。另外，还要感谢我的同事唐炜，他在我写书的后期给了一些很好的建议。
最后要感谢的，是我的夫人李茉，为了让我完成这本书的创作，她付出了家庭方面的很多努力，也为成书给了很多建议和帮助。
谢谢他们！

本书部分资料来源于网上，由于链接失效或无法知道原作者，因此没办法注明来源。请原作者看到后和我联系：wuanch@gmail.com。

第0章　写在前面：神经网络的历史 1
第1章　神经网络是个什么东西 13
1.1　买橙子和机器学习 13
1.1.1　规则列表 14
1.1.2　机器学习 15
1.2　怎么定义神经网络 16
1.3　先来看看大脑如何学习 16
1.3.1　信息输入 17
1.3.2　模式加工 17
1.3.3　动作输出 18
1.4　生物意义上的神经元 19
1.4.1　神经元是如何工作的 19
1.4.2　组成神经网络 22
1.5　大脑如何解决现实生活中的分类问题 24
第2章　构造神经网络 26
2.1　构造一个神经元 26
2.2　感知机 30
2.3　感知机的学习 32
2.4　用代码实现一个感知机 34
2.4.1　Neuroph：一个基于Java的神经网络框架 34
2.4.2　代码实现感知机 37
2.4.3　感知机学习一个简单逻辑运算 39
2.4.4　XOR问题 42
2.5　构造一个神经网络 44
2.5.1　线性不可分 45
2.5.2　解决XOR问题（解决线性不可分） 49
2.5.3　XOR问题的代码实现 51
2.6　解决一些实际问题 54
2.6.1　识别动物 54
2.6.2　我是预测大师 59
第3章　深度学习是个什么东西 66
3.1　机器学习 67
3.2　特征 75
3.2.1　特征粒度 75
3.2.2　提取浅层特征 76
3.2.3　结构性特征 78
3.3　浅层学习和深度学习 81
3.4　深度学习和神经网络 83
3.5　如何训练神经网络 84
3.5.1　BP算法：神经网络训练 84
3.5.2　BP算法的问题 85
3.6　总结深度学习及训练过程 86
第4章　深度学习的常用方法 89
4.1　模拟大脑的学习和重构 90
4.1.1　灰度图像 91
4.1.2　流行感冒 92
4.1.3　看看如何编解码 93
4.1.4　如何训练 95
4.1.5　有监督微调 97
4.2　快速感知：稀疏编码（Sparse Coding） 98
4.3　栈式自编码器 100
4.4　解决概率分布问题：限制波尔兹曼机 102
4.4.1　生成模型和概率模型 102
4.4.2　能量模型 107
4.4.3　RBM的基本概念 109
4.4.4　再看流行感冒的例子 111
4.5　DBN 112
4.6　卷积神经网络 114
4.6.1　卷积神经网络的结构 116
4.6.2　关于参数减少与权值共享 120
4.6.3 举个典型的例子：图片内容识别 124
4.7　不会忘记你：循环神经网络 131
4.7.1　什么是RNN 131
4.7.2　LSTM网络 136
4.7.3　LSTM变体 141
4.7.4　结论 143
4.8　你是我的眼：利用稀疏编码器找图像的基本单位 143
4.9　你是我的眼（续） 150
4.10　使用深度信念网搞定花分类 160
第5章　深度学习的胜利：AlphaGo 169
5.1　AI如何玩棋类游戏 169
5.2　围棋的复杂性 171
5.3　AlphaGo的主要原理 173
5.3.1　策略网络 174
5.3.2　MCTS拯救了围棋算法 176
5.3.3　强化学习：“周伯通，左右互搏” 179
5.3.4　估值网络 181
5.3.5　将所有组合到一起：树搜索 182
5.3.6　AlphaGo有多好 185
5.3.7　总结 187
5.4　重要的技术进步 189
5.5　一些可以改进的地方 190
5.6　未来 192
第6章　两个重要的概念 194
6.1　迁移学习 194
6.2　概率图模型 197
6.2.1　贝叶斯的网络结构 201
6.2.2　概率图分类 204
6.2.3　如何应用PGM 208
第7章　杂项 210
7.1　如何为不同类型的问题选择模型 210
7.2　我们如何学习“深度学习” 211
7.3　如何理解机器学习和深度学习的差异 212
7.4　大规模学习（Large Scale Learning）和并行计算 214
7.5　如果喜欢应用领域，可以考虑以下几种应用 215
7.6　类脑：人工智能的终极目标 216
参考文献 218
术语 220