深度学习原理与TensorFlow实践
  • 推荐0
  • 收藏4
  • 浏览6.3K

深度学习原理与TensorFlow实践

喻俨 , 莫瑜 , 王琛 , 胡振邦 , 高杰 (作者)  刘皎 (责任编辑)

  • 书  号:978-7-121-31298-4
  • 出版日期:2017-06-01
  • 页  数:304
  • 开  本:16(170*240)
  • 出版状态:图书立项
  • 维护人:刘皎
《深度学习原理与TensorFlow实践》主要介绍了深度学习的基础原理和TensorFlow系统基本使用方法。TensorFlow是目前机器学习、深度学习领域最优秀的计算系统之一,《深度学习原理与TensorFlow实践》结合实例介绍了使用TensorFlow开发机器学习应用的详细方法和步骤。同时,《深度学习原理与TensorFlow实践》着重讲解了用于图像识别的卷积神经网络和用于自然语言处理的循环神经网络的理论知识及其TensorFlow实现方法,并结合实际场景和例子描述了深度学习技术的应用范围与效果。
《深度学习原理与TensorFlow实践》非常适合对机器学习、深度学习感兴趣的读者,或是对深度学习理论有所了解,希望尝试更多工程实践的读者,抑或是对工程产品有较多经验,希望学习深度学习理论的读者。
技术社区领袖好评力荐,亲身实践的一手案例,快速上手深度学习,代码基于TF1.0版
喻俨,百纳信息(海豚浏览器)研发副总裁。2007年加入微软亚洲工程院,2011年加入百纳信息负责海外业务线,从0到1做过多个项目,现致力于AI和大数据产品的研究与应用。

莫瑜,先后任职于微软和海豚浏览器,从事搜索引擎、音乐检索/哼唱搜索、内容分发推荐算法和对话机器人技术研发。长期以来持续关注和实践大规模数据算法性能优化、搜索引擎、推荐系统和人工智能技术。

王琛,英国爱丁堡大学人工智能专业硕士,现为百纳信息技术有限公司人工智能方向负责人。早年参加过信息学奥林匹克竞赛获得河北省第一名、全国三等奖,并保送进入中山大学。大学期间,在ACM竞赛上也屡获佳绩。硕士毕业后就职于百度基础架构部,参与大数据平台研发工作,对大数据分析处理、分布式系统架构等方面都有比较深刻的理解。2014年加入百纳,负责多个项目的研发,自2016年起负责人工智能方向的探索。

胡振邦,拥有博士学位,百纳信息技术有限公司高级算法研究员,毕业于中国地质大学计算机学院地学信息工程专业。读博期间,参与了关于遥感卫星图像识别分析的863项目,并且是主要的研发人员。毕业以来,一直从事图像识别方面的算法研发工作,主要方向包括目标检测、图文检索、图像分类与验证等,在图像处理、计算机视觉等方面都有深厚的积累和经验。

高杰,是一位1980年出生于苏北的“爱学习、能折腾、有情怀”的大叔。毕业于扬州中学特招班,1998年入学华中科技大学机械系,兼修管理、会计,自学计算机,2003年考入南京大学软件学院,曾任德国西门子内部SAP咨询师,还在中银国际TMT投行、金山软件集团投资部任过职,2015年与合伙人联合创立了图灵科技集团,与华尔街顶尖交易团队一起致力于量化交易、算法模型和人工智能在金融领域的应用,目前这家公司管理着超过20亿元的资产,是细分市场的领先公司。
创造出具有智能的机器一直是人们梦寐以求的理想。自20世纪50年代图灵测试被提出以来,人工智能就成为了计算机科学领域中一个极具吸引力的研究方向。近年来,深度学习是机器学习领域中一个非常具有突破性的研究方向,从AlphaGo战胜李世石,到Prisma运用深度学习技术制作滤镜刷爆全世界的社交网络,深度学习在图像处理、自然语言处理甚至博弈决策等问题上不断取得震惊世人的成绩。
随着科研理论上的不断突破,机器学习基础架构方面也有了长足进步。为了提高科研和应用的开发效率,面向深度学习的开发框架不断涌现,而TensorFlow就是其中的佼佼者。依托于Google强大的影响力,TensorFlow一经发布就吸引了整个行业的关注。TensorFlow自2015年年底在GitHub开源以来,一直是机器学习、深度学习类别中关注度最高的项目,截至2016年年底,已经获得超过40000个Star。同时,在开源社区共同的努力下,基于TensorFlow开发的各种算法和应用都在飞速增加。
本书结合基于TensorFlow实践的应用代码,介绍了深度学习的基础概念和知识,但需要读者预先掌握一些传统机器学习、神经网络相关方面的知识。同时,本书代码主要基于目前最新的TensorFlow 1.0版本,大部分为Python代码,需要读者有一定的Python语言基础。希望通过本书的介绍,读者可以由浅入深、由理论到实践全面掌握深度学习的基础知识和实践方法。
本书第1章介绍了深度学习的由来以及发展趋势,简要说明了人工智能、机器学习、深度学习等名词概念之间的联系。第2章主要介绍了TensorFlow系统的基础知识和一些重要概念。第3章通过对Kaggle竞赛平台上的Titanic问题的求解实例,介绍了TensorFlow系统的基本用法,并简要介绍了机器学习问题中的一些常用的处理技巧。第4章和第5章分别介绍了主要应用于图像处理领域的卷积神经网络CNN和主要应用于自然语言处理领域的循环神经网络RNN。其中第4章介绍了CNN的基本原理和多个经典网络结构,并通过图像风格化的实例展示了CNN在更多场景下应用的可能性。第5章介绍了RNN、LSTM以及它们的多种变种结构,并通过实例介绍了如何构建实用的语言模型和对话机器人。第6章介绍了卷积神经网络与循环神经网络的结合,通过图像检测和图像摘要两个问题介绍了CNN+LSTM相结合的威力。最后的第7章介绍了机器学习中非常重要的损失函数与优化算法在TensorFlow中的实现,对实际使用深度学习解决问题都有极大帮助。
在此感谢互联网时代,感谢Google的开源精神,让我们可以如此紧跟时代最前沿的技术,也可以为技术的进步做出自己微薄的贡献。还要感谢电子工业出版社刘皎编辑对新技术的关注和推广,感谢同事、家人、各位好友的支持和帮助,有你们的支持才有此书的出版,不胜感激。
作 者

目录

1 深度学习简介 1
1.1 深度学习介绍 1
1.2 深度学习的趋势 7
1.3 参考资料 10
2 TensorFlow系统介绍 12
2.1 TensorFlow诞生的动机 12
2.2 TensorFlow系统简介 14
2.3 TensorFlow基础概念 16
2.3.1 计算图 16
2.3.2 Session会话 18
2.4 系统架构 19
2.5 源码结构 21
2.5.1 后端执行引擎 22
2.5.2 前端语言接口 24
2.6 小结 24
2.7 参考资料 25
3 Hello TensorFlow 26
3.1 环境准备 26
3.1.1 Mac OS安装 27
3.1.2 Linux GPU服务器安装 28
3.1.3 常用Python库 32
3.2 Titanic题目实战 34
3.2.1 Kaggle平台介绍 34
3.2.2 Titanic题目介绍 35
3.2.3 数据读入及预处理 38
3.2.4 构建计算图 40
3.2.5 构建训练迭代过程 44
3.2.6 执行训练 46
3.2.7 存储和加载模型参数 47
3.2.8 预测测试数据结果 50
3.3 数据挖掘的技巧 51
3.3.1 数据可视化 52
3.3.2 特征工程 54
3.3.3 多种算法模型 57
3.4 TensorBoard可视化 58
3.4.1 记录事件数据 58
3.4.2 启动TensorBorad服务 60
3.5 数据读取 62
3.5.1 数据文件格式 63
3.5.2 TFRecord 63
3.6 SkFlow、TFLearn与TF-Slim 67
3.7 小结 69
3.8 参考资料 69
4 CNN“看懂”世界 71
4.1 图像识别的难题 72
4.2 CNNs的基本原理 74
4.2.1 卷积的数学意义 75
4.2.2 卷积滤波 77
4.2.3 CNNs中的卷积层 81
4.2.4 池化(Pooling) 83
4.2.5 ReLU 84
4.2.6 多层卷积 86
4.2.7 Dropout 86
4.3 经典CNN模型 87
4.3.1 AlexNet 88
4.3.2 VGGNets 95
4.3.3 GoogLeNet & Inception 98
4.3.4 ResNets 106
4.4 图像风格转换 109
4.4.1 量化的风格 109
4.4.2 风格的滤镜 116
4.5 小结 120
4.6 参考资料 121
5 RNN“能说会道” 123
5.1 文本理解和文本生成问题 124
5.2 标准RNN模型 128
5.2.1 RNN模型介绍 128
5.2.2 BPTT算法 130
5.2.3 灵活的RNN结构 132
5.2.4 TensorFlow实现正弦序列预测 135
5.3 LSTM模型 138
5.3.1 长期依赖的难题 138
5.3.2 LSTM基本原理 139
5.3.3 TensorFlow构建LSTM模型 142
5.4 更多RNN的变体 144
5.5 语言模型 146
5.5.1 NGram语言模型 146
5.5.2 神经网络语言模型 148
5.5.3 循环神经网络语言模型 150
5.5.4 语言模型也能写代码 152
5.5.5 改进方向 163
5.6 对话机器人 164
5.6.1 对话机器人的发展 165
5.6.2 基于seq2seq的对话机器人 169
5.7 小结 181
5.8 参考资料 182
6 CNN+LSTM看图说话 183
6.1 CNN+LSTM网络模型与图像检测问题 184
6.1.1 OverFeat和Faster R-CNN图像检测算法介绍 185
6.1.2 遮挡目标图像检测方法 187
6.1.3 ReInspect算法实现及模块说明 188
6.1.4 ReInspect算法的实验数据与结论 204
6.2 CNN+LSTM网络模型与图像摘要问题 207
6.2.1 图像摘要问题 208
6.2.2 NIC图像摘要生成算法 209
6.2.3 NIC图像摘要生成算法实现说明 214
6.2.4 NIC算法的实验数据与结论 243
6.3 小结 249
6.4 参考资料 250
7 损失函数与优化算法 253
7.1 目标函数优化策略 254
7.1.1 梯度下降算法 254
7.1.2 RMSProp优化算法 256
7.1.3 Adam优化算法 257
7.1.4 目标函数优化算法小结 258
7.2 类别采样(Candidate Sampling)损失函数 259
7.2.1 softmax类别采样损失函数 261
7.2.2 噪声对比估计类别采样损失函数 281
7.2.3 负样本估计类别采样损失函数 286
7.2.4 类别采样logistic损失函数 286
7.3 小结 287
7.4 参考资料 288
结语 289

读者评论

  • 《深度学习原理与TensorFlow实践》配书资料下载地址:https://github.com/DeepVisionTeam/TensorFlowBook

    caonima发表于 2018/8/1 15:37:22
  • 书上首先要到kaggle网站上下载titianic数据,但是kaggle注册总是失败,原因是注册这个东西需要开vpn,否则在激活那一步总是不成功。

    caonima发表于 2018/8/1 10:57:23
  • 184页的,看图说话的代码在哪呢?

    happyanyday发表于 2018/6/17 10:15:38
  • 喻老师 , 莫老师 , 王老师 , 胡老师 , 高老师,您们好!或者可否给《www.broadview.com.cn》我用户名skyfly000_111_222发私信,帮我解决,辛苦了!非常感谢!

    skyfly000_111_222发表于 2017/11/24 12:44:48
  • 喻老师 , 莫老师 , 王老师 , 胡老师 , 高老师,您们好!我是一深度学习的小菜鸟,我觉得这本书写得挺好的,但是个别的程序我运行过程中遇到一些困难,如neural_style.py,先是“ArgumentError: argument conflicting option string”,之后是“IndexError: index out of range”,确实是需要老师们持续的指导和帮助,我如何能联系到老师们?是否有相应的微信群或QQ群?请教下,非常感谢!

    skyfly000_111_222发表于 2017/11/24 12:40:39

相关博文

相关图书

程序员的AI书:从代码开始

张力柯 潘晖 (作者)

随着AI技术的普及,如何快速理解、掌握并应用AI技术,成为绝大多数程序员亟需解决的问题。本书基于Keras框架并以代码实现为核心,详细解答程序员学习AI算法时的...

¥76.30

解析深度学习:卷积神经网络原理与视觉实践

魏秀参 (作者)

深度学习,特别是深度卷积神经网络是人工智能的重要分支领域,卷积神经 网络技术也被广泛应用于各种现实场景,在许多问题上都取得了超越人类智能的 结果。本书作为该...

¥49.00

自然语言处理理论与实战

白宁超 (作者)

自然语言处理是什么?谁需要学习自然语言处理?自然语言处理在哪些地方应用?相关问题一直困扰<br>着不少初学者。针对这一情况,作者结合教学经验和工程应用编写此书。...

¥79.00

深度学习之PyTorch实战计算机视觉

唐进民 (作者)

计算机视觉、自然语言处理和语音识别是目前深度学习领域很热门的三大应用方向,本书旨在帮助零基础或基础较为薄弱的读者入门深度学习,达到能够独立使用深度学习知识处理计...

¥49.00

21个项目玩转深度学习——基于TensorFlow的实践详解

何之源 (作者)

《21个项目玩转深度学习——基于TensorFlow的实践详解》以实践为导向,深入介绍了深度学习技术和TensorFlow框架编程内容。 通过本书,读者可以训...

¥59.00

TensorFlow:实战Google深度学习框架(第2版)

郑泽宇 (作者)

TensorFlow是谷歌2015年开源的主流深度学习框架,目前已得到广泛应用。本书为TensorFlow入门参考书,旨在帮助读者以快速、有效的方式上手Tens...

¥89.00