本书系统地讲解了深度学习的基本知识、建模过程和应用,并以深度学习在推荐系统、图像识别、自然语言处理、文字生成和时间序列中的具体应用为案例,详细介绍了从工具准备、数据获取和处理到针对问题进行建模的整个过程和实践经验,是一本非常好的深度学习入门书。
不同于许多讲解深度学习的书籍,本书以实用为导向,选择了 Keras 作为编程框架,强调简单、快速地设计模型,而不去纠缠底层代码,使得内容相当易于理解,读者可以在 CNTK、 TensorFlow 和 Theano 的后台之间随意切换,非常灵活。并且本书能帮助读者从高度抽象的角度去审视业务问题,达到事半功倍的效果。
该书以实际应用为导向,强调概念的认知和实用性,对理论的介绍深入浅出,对读者的数学水平要求较低,读者在学习完毕后能使用案例程序举一反三地应用到其具体场景中。本书覆盖当前最热门的传统数据挖掘场景和四个深度学习应用场景,根据我们市场调研,是目前唯一一本以应用为导向的介绍机器学习和深度学习的专业书籍,具备很高的参考价值和学术价值
谢梁
现任微软云计算核心存储部门首席数据科学家,主持运用机器学习和人工智能方法优化大规模高可用性并行存储系统的运行效率和改进其运维方式。具有十余年机器学习应用经验,熟悉各种业务场景下机器学习和数据挖掘产品的需求分析、架构设计、算法开发和集成部署,涉及金融、能源和高科技等领域。曾经担任美国道琼斯工业平均指数唯一保险业成分股的旅行家保险公司分析部门总监,负责运用现代统计学习方法优化精算定价业务和保险运营管理,推动精准个性化定价解决方案。在包括Journal of Statistical Software等专业期刊上发表过多篇论文,担任Journal of Statistical Computation and Simulation期刊以及Data Mining Applications with R一书的审稿人。本科毕业于西南财经大学经济学专业,博士毕业于纽约州立大学计量经济学专业。
鲁颖
现任谷歌硅谷总部数据科学家,为谷歌应用商城提供核心数据决策分析,利用机器学习和深度学习技术建立用户行为预测模型,为产品优化提供核心数据支持。曾在亚马逊、微软和迪士尼美国总部担任机器学习研究科学家,有着多年使用机器学习和深度学习算法研发为业务提供解决方案的经验。热衷于帮助中国社区的人工智能方面的研究和落地,活跃于各个大型会议并发表主题演讲。本科毕业于复旦大学数学专业,博士毕业于明尼苏达大学统计专业。
劳虹岚
现任微软研究院研究工程师,是早期智能硬件项目上视觉和语音研发的核心团队成员,对企业用户和消费者需求体验与AI技术的结合有深刻的理解和丰富的经验。曾在Azure和Office 365负责处理大流量高并发的后台云端研究和开发,精通一系列系统架构设计和性能优化方面的解决方案。拥有从前端到后端的丰富经验:包括客户需求判断、产品开发以及最终在云端架构设计和部署。本科毕业于浙江大学电子系,硕士毕业于美国南加州大学(USC)电子和计算机系。
2006 年,机器学习领域迎来了重要的转折点。加拿大多伦多大学教授、机器学习领域泰斗 Geoffrey Hinton 和他的学生 Ruslan Salakhutdinov 在《科学》上发表了一篇关于深度置信网络 (Deep Belief Networks) 的论文。从这篇论文的发表开始至今,深度学习有着迅猛的发展。 2009 年,微软研究院语音识别专家俞栋和邓力博士与深度学习专家Geoffery Hinton 合作。 2010 年,美国国防部 DARPA 和斯坦福大学、纽约大学和 NEC美国研究院合作深度学习项目。 2011 年微软宣布基于深度神经网络的识别系统取得成果并推出产品,彻底改变了语音识别原有的技术框架。从 2012 到 2015 年,深度学习技术在图像识别领域取得惊人的效果,在 ImageNet 评测上将错误率从 26% 一路降到 5%以下,几乎接近甚至超过人类的水平。这些都直接促进了一系列围绕深度学习技术的智能产品在市场上的出现,比如微软的认知服务(Cognitive Services)平台,谷歌的智能邮件应答和谷歌助手等。
在中国,我们同样欣喜地看到,基于大数据的机器学习和深度学习算法的大规模应用给互联网行业带来的巨大变革:淘宝的推荐算法、微软的小冰聊天机器人、百度的度秘、滴滴的预估时间和车费、饿了么的智能调度等都应运而生。我们有理由相信,未来的物联网、无人驾驶等也会挖掘出更多深度学习的实用场景。
深度学习对很多科技行业的从业者来说仍有一些神秘感。虽然像谷歌、微软等互联网巨头开源了诸如 TensorFlow、 CNTK 等深度学习平台,大幅降低了从业者的门槛,但是如何举一反三,根据实际问题选择合适的算法和模型,并不容易。作为本书的作者,我们三位在美国谷歌、微软等顶尖互联网科技公司从事多年以机器学习和深度学习为基础的人工智能项目研发,有着丰富的实践经验,深感有必要撰写一本深入浅出的深度学习书籍,分享我们对深度学习的理解和想法,并帮助同行和感兴趣的朋友们快速上手,建立属于自己的端到端的深度学习模型,从而在大数据、深度学习的浪潮中有着更好的职业发展。我们希望本书能起到抛砖引玉的作用,使读者对深度学习产生更多的兴趣,并把深度学习作为一个必备的分析技能。
在本书中,我们选择 Keras 这个流行的深度学习建模框架来讲解深度学习话题。这主要从三方面的考虑。首先, Keras 包括了各种常用的深度学习模块,可以应用于绝大部分业务环境。其次,从原理上讲,它是高度抽象的深度学习编程环境,简单易学。 Keras底层是调用 CNTK、 TensorFlow 或 Theano 执行计算的。最后,作为应用领域的从业者,我们需要关注的是如何把一个商业或者工程问题转化成合适的模型,如何准备数据和分析模型的好坏以及如何解释模型的结果。 Keras 非常适合这样的场景,让使用者脱离具体的矩阵计算和求导,而将重心转移到业务逻辑上。
本书是目前国内不多的系统讲解使用 Keras 这个深度学习框架进行神经网络建模的实用书籍,非常适合数据科学家、机器学习工程师、人工智能应用工程师和工作中需要进行预测建模以及进行回归分析的从业者。本书也适合对深度学习有兴趣的不同背景的从业者、学生和老师。
本书分成 10 章,系统性地讲解深度学习基本知识、使用 Keras 建模过程和应用,并提供详细代码,使读者可以花最少的时间把核心建模知识学到手。其中第 1 章介绍搭建深度学习环境,是整本书的基础。第 2 章介绍如何用网络爬虫技术收集数据并使用ElasticSearch 存储数据。因为在很多应用中,数据需要读者自行从网上爬取和并加以处理和存储。第 3 章介绍深度学习模型的基本概念。第 4 章介绍深度学习框架 Keras 的用法。第 5~9 章,是 5 个深度学习的经典应用。我们会依次介绍深度学习在推荐系统、图像识别、自然语言处理、文字生成和时间序列的具体应用。在介绍这些应用的过程中会穿插各种深度学习模型和代码,并和读者分享我们对于这些模型的原理和应用场景的体会。最后,我们抛砖引玉地把物联网的概念提出来。我们相信,物联网和深度学习的结合会爆发出巨大的能量和价值。
限于篇幅,我们无法涉及深度学习的方方面面,只能尽自己所能,和大家分享尽可能多的体会、经验和易于上手的代码。
在写书的过程中,我们得到了大量的帮助和指导。微软 CNTK 的作者、国际顶尖深度学习专家俞栋博士和张察博士为本书作序,并给予我们许多支持和鼓励。微软研究院的研究员郭彦东博士和高级工程师汤成对本书的部分章节提出了审阅意见。电子工业出版社的张慧敏、葛娜和王静老师,对书籍的出版和编辑付出了极大努力,才使这本书得以如期问世。在此一并感谢。
最后,我们三位作者希望本书能为中国的深度学习和人工智能的普及,为广大从业者提供有价值的实践经验和快速上手贡献我们的微薄之力。
谢梁,美国微软总部首席数据科学家
鲁颖,谷歌总部数据科学技术专家
劳虹岚,美国微软总部微软研究院研究工程师
2017 年 6 月于美国西雅图和硅谷
“其实吉列的博瑞也不错“ 正确应该是 “其实吉利的博瑞也不错“