随着大数据和人工智能的发展,深度学习成为时下关注的技术热点。本选题旨在以浅显易懂的方式介绍深度学习的基本理念和技术架构,帮助从事相关工作的人们对深度学习有一个基本全面的认识。包括对神经网络基本原理的介绍、如何构建一个最基础的神经网络模型、深度学习是什么、怎么用?如何用深度学习来解决问题。
神经网络与深度学习算法入门书
很多朋友告诉我,一本书总是要加一个前言才算完整。如果书没有前言,就好像只有山没有水一样,没有意境。
对我来说,这是我的第一本技术科普类读物。之所以把它称作第一本,是因为我从前没写过书,哪怕是一篇超过4万字的文章(论文不算)都没写过,所以听编辑说写书有字数要求时,我都没有概念,心想不就写本书吗?easy!
写着写着发现不对了,自己没有为一本书建立好整体知识体系!从2014年开始断断续续地写着,中间有段时间甚至想过放弃。我之所以没放弃,无非是因为觉得做事要有始有终。如果我写得不好,那是我的能力有限;如果因为一些之前估计不到的难度就放弃了,那是态度问题!
为什么说这是一本科普类读物呢?至少在我写书时,很多人(都是IT、软件这个行业的人)对于神经网络、深度学习(Deep Learning)等都毫无概念,如果连这些人对神经网络等都没有概念,可以想象其普及程度有多低。但我觉得深度学习并不是只有大学学府或几个相关的专业学生才能研究它;并不是只有公司里这个领域的专家才能研究它,它是属于整个大众的东西。
对于技术层面的东西,将会慢慢简化再简化,如同编程语言一样,开始是汇编语言,后来是C语言,再后来有了C++,再后来有了Java,甚至出现了Python、JavaScript,它们降低了进入门槛,可以让更多人使用。对的,编程语言的进化就是让更多人更便捷地使用。对于深度学习来说,基本的算法库至少目前来讲已经很多很多了,这些算法库基本覆盖了我们的现代编程语言,让人能够更方便地使用。微软甚至出了一个图形化的深度学习在线工具,你只要拖曳下鼠标就能得到一个算法并训练它,极大地加快了学习效率。
我强调这一点是想说:技术的进步扩散了这些技术,最终目标也许就是机器像人类那样思考,让人类想什么有什么,而不仅仅局限于技术层面;而今天深度学习的进化已经可以使机器通过学习已有的知识就能推导出或预测出未知的事物,想起这点时常让我激动,让我觉得创造出一个机器生命体是有可能的!所以写本书的意义在于让人们不过多地关注公式及推导过程,而是关注它的使用方法,把人类的想法迅速转换成生产力才是目的,毕竟只有人类的想法才是最有价值的!
按以上思路,我安排书的整体目录架构如下。
第0章,介绍机器学习、神经网络的历史,好让大家有基本的了解。
第1章,解释大脑的运作结构和如何利用仿生学产生逻辑上的神经元和神经网络。
第2章,我们用仿生学的知识试着构造一个神经网络(感知机)并使用它做些事情,解释了XOR问题。在2.6节给出一些例子,让我们能更好地了解神经网络是如何分类学习和预测的。
第3章,介绍深度学习的基本概念,深度学习和神经网络的联系。
第4章,介绍深度学习的常用方法。
第5章,介绍AlphaGo。
第6章,两个重要概念,迁移学习和概率图模型PGM。
第7章,给出了一些经验以加快大家学习和研究的效率。
按照惯例,在前言的最后一部分应该做一些感谢,首先要感谢张杰同学,是他介绍了我和电子工业出版社的编辑认识。感谢我的编辑刘皎,对于一个刚刚进入写书圈子的新人,她给予了我很多帮助和支持。另外,还要感谢我的同事唐炜,他在我写书的后期给了一些很好的建议。
最后要感谢的,是我的夫人李茉,为了让我完成这本书的创作,她付出了家庭方面的很多努力,也为成书给了很多建议和帮助。
谢谢他们!
本书部分资料来源于网上,由于链接失效或无法知道原作者,因此没办法注明来源。请原作者看到后和我联系:wuanch@gmail.com。