《智能问答与深度学习》面向在校学生或计算机软件从业人员,由浅入深地介绍了人工智能在文本任务中的应用。《智能问答与深度学习》不但介绍了自然语言处理、深度学习和机器阅读理解等基础知识,还简述了信息论、人工智能等的发展过程。
深度学习、自然语言处理入门书
为你开启从AI入门到AI应用的学习之门
提供大量编程实例,配书源代码供下载
王海良,Chatopera联合创始人、CEO,微软人工智能最有价值专家。毕业于北京邮电大学,加入IBM工作四年,先后工作于软件开发实验室和创新中心,从2016年开始工作于创业公司,三角兽AI算法工程师,呤呤英语AI产品负责人,负责智能对话系统研发。
李卓桓,PreAngel合伙人,Plug and Play投资合伙人。拥有25年编程经验,曾任优酷网首席科学家、叽歪网创始人,水木清华BBS站长,紫霞BBS站长。Conversational AI实践者,热爱滑雪、跑酷、滑雪伞等极限运动。
林旭鸣,北京邮电大学模式识别实验室研究生,目前的研究方向为深度学习、自然语言处理与机器阅读理解。本科期间曾获得国家奖学金,研究生期间多次在数据类竞赛中取得Top 3的成绩。曾在百度、滴滴出行、微软等公司实习。
推荐序1
我们生活在一个美好的时代,人工智能在实际中的应用越来越广泛,很多前人畅想过的事情正在变成现实。同时,作为科技工作者,我们也应该抓住时代给予的机会,让机器更好地服务于人。智能问答是一个重要方向,今天我们所使用的搜索引擎和20 世纪末它刚刚出现时已经截然不同,基于海量数据及复杂的算法,其答案的精确程度让人惊叹。但是有一天,它会不会只给我们一个答案,不是一个列表,而是唯一的回答?随着语音交互的日益普及,这个需求有着重要的价值。那么,怎么样才能让机器准确地理解人的问题呢?深入的思考会带来更多的问题,世界上最聪明的一群人正在尝试解决这些问题。
本书介绍了近年来自然语言处理和机器阅读的成果,带有翔实的示例,对实际应用有很好的借鉴意义。而且本书从原理上进行了解释,这样更能帮助读者掌握这些技术,融会贯通,促进更多的创新,是入门自然语言处理和深度学习难得的好书。
王海良先生是本书作者之一,我们是因为共同兴趣——探索实现智能的聊天机器人而认识的。他对智能问答有着很高的积极性,尤其对企业普及聊天机器人应用有着强烈的愿景。本书中很多内容是作者的真知灼见,“问渠那得清如许,为有源头活水来”。我向大家强烈推荐本书!
李纪为,香侬科技CEO
推荐序2
人工智能时代已经到来,2018 年5 月OpenAI 发布报告,其中提到在人工智能训练任务中使用的算力呈指数级增长,其目前速度为每3.5 个月翻一倍(相比之下,摩尔定律是每18 个月翻一倍)。自2012 年以来,人们对算力的需求增长了超过300 000 倍,未来4 年每年还会增长10 倍,这意味着4 年后人工智能训练的算力规模将是现在的1 万倍。
IBM 研究称,在全人类的全部数据中90% 是在最近两年内产生的,到2020 年,全世界的数据规模将是今天的44 倍。每一天,全世界会上传超过6 亿张图片,到2017 年年底已有4.7 万亿张图片被存储。
所有行业都在数字化和互联网化,所有互联网公司都将AI 化。只有充分掌握使用人工智能进行经营决策的企业才能成为行业领导者。每家公司都需要人工智能工程师和分析师。
现在全国每年毕业的人工智能博士生不足千名,硕士生不足万名。面对行业人才短缺,需要更多的在职工程师和非人工智能专业的硕博人才加快进入这个领域。
最新出版的计算机专业图书已有一半和人工智能相关,书的数量不少,但真正有学习价值的却不多,大部分都集中在图像识别领域。
其实语音交互及智能问答是人工智能正在快速发展的方向,而且应用领域广泛。垂直行业的人工智能应用有着巨大潜力,需要更多的工程师加入这一行列中。当前最需要的就是有动手能力实现AI 项目,并且具备基础知识体系的人,他们能够根据项目应用场景和数据的不同而调整设计相应的算法模型。
当前最易入手的就是针对不同行业深入挖掘行业知识,智能问答是入口。本书是有着满满干货的好书。本书从智能问答系统的应用实例出发,系统讲解了深度学习必备的数学知识,还有丰富的工程项目资源和实践分析。按图索骥,顺着作者的指引,就能掌握智能问答系统所需要的知识体系。
蒋涛,CSDN 创始人、极客帮创始人
前言
人工智能热潮袭来,很多人对它有着美好的预期,因为在很多工作岗位上,人们重复劳动,或者工作强度大,甚至是危险的,是不是人工智能产品能够改变这种现状?另外,技术人员出于研究的目的开始学习机器学习技术。人工智能就像是一片蓝海,甚至上升到国家战略的高度,《人工智能基础(高中版)》已经于2018 年出版,未来将有更多的人才进入这个迷人的领域。
近两年,人工智能有愈演愈烈之势,这得益于很多人对开源社区的贡献,因为从理论研究过渡到生产实践需要一个过程,开源社区大大地加速了这个过程。人工智能的创新受益于原创思想,通常这些思想以学术论文的形式发布。因此,关注arXiv 上关于使用机器学习完成各种文本任务是我的一个爱好。一些优秀的论文被发布后,也可以在GitHub 上找到对应的开源项目和开放数据集,这使得爱好者或广大技术人员不但有机会接触前沿的研究成果,而且可以实践,从而应用或继续创新。
目前,市场上有很多关于人工智能的书籍,本书是作者在学习和使用人工智能技术的过程中总结和整理而成的。我通过论文、开源项目、工作和比赛等方式慢慢进入机器学习的殿堂,回忆这两年开发人机对话系统的经历,感觉如果有一本书能从原理出发,同时也不失实践的指导意义,将会大大加速掌握机器学习的过程,于是便产生了写这样一本书的想法。
本书有助于科研人员和爱好者学习深度学习、自然语言处理和机器阅读,也可以作为深度学习和自然语言处理相关课程的教学参考书。本书配套了很多代码示例。
本书初稿由王海良、李卓桓和林旭鸣完成,经过陈可心和李思珍的编写,完善了部分章节。在本书编写过程中,电子工业出版社的编辑郑柳洁和葛娜提供了很多帮助,在此向她们表示衷心的感谢。同时,感谢给予鼓励和支持的家人、朋友们。
由于作者水平有限,书中难免有疏漏、不当之处,欢迎读者朋友予以指正。建议或意见请发表在GitHub(https://github.com/l11x0m7/book-of-qna-code/issues)上。
王海良