本书首先介绍了深度学习相关的理论和主流的深度学习框架,然后从Caffe 深度学习框架为切入点,
介绍了Caffe 的安装、配置、编译和接口等运行环境,剖析Caffe 网络模型的构成要素和常用的层类型和Solver 方法。通过LeNet 网络模型的Mnist 手写实例介绍其样本训练和识别过程,进一步详细解读了
AlexNet、VGGNet、GoogLeNet、Siamese 和SqueezeNet 网络模型,并给出了这些模型基于Caffe 的训练实战方法。然后,本书解读了利用深度学习进行目标定位的经典网络模型:FCN、R-CNN、Fast-RCNN、Faster-RCNN 和SSD,并进行目标定位Caffe 实战。本书的最后,从著名的Kaggle 网站引入了两个经典的实战项目,并进行了有针对性的原始数据分析、网络模型设计和Caffe 训练策略实践,以求带给读者从问题提出到利用Caffe 求解的完整工程经历,从而使读者能尽快掌握Caffe 框架的使用技巧和实战经验。
针对Caffe 和深度学习领域的初学者,本书是一本不可多得的参考资料。本书的内容既有易懂的理论
背景,又有丰富的应用实践,是深度学习初学者的指导手册,也可作为深度学习相关领域工程师和爱好者的参考用书。
是时候,将深度学习应用到实践了!全面提升深度学习的应用能力!占领未来科技的至高点!
2016 年3 月,Google 开发的一款人工智能程序阿尔法围棋(AlphaGo)对战世界围棋冠军、职业九段选手李世石,以4:1 的总比分获胜。众多媒体和网络新闻纷纷直播或转载此次人工智能应用领域内的盛况。随后,Google 在《Nature》杂志发表了关于AlphaGo 算法的论文“Mastering the game of Go with deep neural networks and tree search”。此论文提到了AlphaGo 用3,000 万棋局训练深度神经网络的方法,展现了深度学习异常强大的学习能力。一时间,国内外掀起了研究和学习人工智能的热潮。然而,很多读者朋友希望能找到一本关于深度学习应用领域的书籍,目前市场上关于人工智能、机器学习或深度学习领域内的各类书目很多,遗憾的是这些书籍大多是理论性质的,少有系统介绍深度学习的应用实践参考书。
与此同时,笔者认为深度学习的应用能力会成为一个爆发性需求的知识技能,也会是未来科技的至高点。鉴于此,我与朋友王斌从去年就计划编写一本关于深度学习的应用实践书籍,希望能够对深度学习爱好者或初学者提供一些帮助。
全书共17 章,第1章介绍了人工智能和深度学习的背景和现状;第2 章介绍了深度学习的基本理论和主流的深度学习框架;第3 章介绍了Caffe 的安装、配置和运行环境;第4章介绍了Caffe 网络模型的构成要素、常用的层类型和Solver 方法;第5~10 章详细解读了LeNet、AlexNet、GoogLeNet、VGGNet、Siamese 和SqueezeNet 目标分类模型,并附上Caffe 实战训练;第11~15 章详细解读了FCN、R-CNN、Fast-RCNN、Faster-RCNN 和SSD目标定位模型;第16~17 章利用Caffe 深度学习框架解求Kaggle 网站的两个经典项目。
本书在内容上对深度学习相关的机器学习理论只作了简单介绍,更多的放在如何应用Caffe 解决实际问题,并把使用当中可能出现的问题也一一列举出来,帮助读者分析原因、解决问题。本书介绍了十多种非常经典的网络模型,学习这些模型可以帮助读者很好地理解和应用Caffe 框架和工具。当然,读者并无必要对这些网络模型一一阅读,也可根据自身情况选择对自己有实际帮助的案例进行分析学习。
由于深度学习技术发展迅速,各种知识和应用工具变化很快,Github 上许多开源的项目也在不断更新和修正。笔者才疏学浅,理解有限,加之编写时间也较仓促,书中难免有错谬之处,敬请广大读者朋友批评指正,不胜感激。
乐 毅
2016 年11 月
P24 第三行汉字:由链定理得:第一个等号后应该是Ev对Sk的偏导数乘以Sk对vki的偏导数吧
P27 倒数第二行 千分之一 改为万分之一吧
P29 倒数第二行892x400=3168400,应改为7921x400=3168400
如果我改的有错误,希望联系我,谢谢 845639326@qq.com。