大数据时代的算法:机器学习、人工智能及其典型实例
  • 推荐0
  • 收藏8
  • 浏览5.1K

大数据时代的算法:机器学习、人工智能及其典型实例

刘凡平 , 张启玉 , 刘刚 (作者) 

  • 书  号:978-7-121-30429-3
  • 出版日期:2017-01-06
  • 页  数:220
  • 开  本:16(185*235)
  • 出版状态:上市销售
  • 维护人:张月萍
本书介绍在互联网行业中经常涉及的算法,包括排序算法、查找算法、资源分配算法、路径分析算法、相似度分析算法,以及与机器学习相关的算法,包括数据分类算法、聚类算法、预测与估算算法、决策算法、关联规则分析算法及推荐算法。本书涉及的相关算法均为解决实际问题中的主流算法,对于工作和学习都有实际参考意义。
本书是一本算法领域内的技术参考书籍,涵盖数十种算法,通过由浅入深的介绍基础算法和机器学习算法相关理论和应用,阐述了各个算法的应用场景及算法复杂度,使读者对算法的理解不只是停留在表面,还从应用的角度提供了大量实例,使读者能够快速、高效进阶各类算法,并能够熟练应用到将来的工作实践中。

大数据时代,只有算法能洞悉数据的内在逻辑,让数据产生商业价值!
致 谢
本书的内容来自于我对日常学习和工作的总结,我要感谢本人曾经的导师于炯教授、叶勇教授,以及在微软和百度工作时的前辈王明雨、何绍建、黄诚,正是你们对我的悉心指导,才能使我有能力和勇气写出这本书,无论你们在哪里,凡平永远心存感激。当然还有那些曾经一起学习的同学、共事的朋友,你们曾经给予我很多无私的帮助,使我在和你们相处的过程中能够快速成长,感谢一路上有你们的陪伴,正是有你们,沿途的风景才格外美丽。
感谢英国的Peter Boden先生,虽然我们素未谋面,但是你却一直支持我们团队去实现自己的梦想,并连续两年无偿支持我们在Github开源社区的项目。在开源项目中,我们实现了不少有一定难度的算法,如果没有你的支持,也许我们不能正常完成相关的研发任务,更不可能去挑战搜索引擎中各类算法,尤其在人工智能领域的算法,对你的感激之情溢于言表。
感谢我的创业伙伴魏琪,当我提出我们一起研究人工智能技术时,你毫不犹豫地选择了和我一起艰苦创业。无论处在创业的何种困难期,你总是为团队加鼓气,你踏实和认真的工作态度让我钦佩不已,感谢你为本书的技术细节提出了真知灼见的修改意见,还有我一起工作的同学和朋友都对本书提出了改进意见,对此也表示深深的感谢。
感谢北京源智天下公司的吉老师及电子工业出版社的各位编辑,对本书的内容都给予了极大的帮助,对本书的出版也付出了辛苦汗水。
衷心感谢我的家人,感谢你们在过去一年中对我的理解和支持,为我营造了一个良好的写作环境,并鼓励我坚持认真写作,使本书能够顺利完成。
本书编写过程中还得到了很多朋友的支持和帮助,限于篇幅,虽然不能一一对你们表示感谢,但是我对你们一样表示感激。
最后,感谢这个时代给予每位有理想的人,赋予实现人生价值的机会!



前 言
中国在很早就开始了算法研究,如《周髀算经》、《九章算术》这类最具历史的算法书籍,以及后来的唐宋元明清各历史朝代也出现了如《一位算法》、《算法绪论》、《算法全书》、《算法统宗》等一系列算法名著,算法已经成为各行各业的基础研究。
本书通过介绍在互联网行业中经常涉及的算法包括排序算法、查找算法、资源分配算法、路径分析算法、相似度分析算法,以及与机器学习相关的算法包括分类算法、聚类算法、预测与估算算法、决策算法、关联规则分析算法及推荐算法。本书是一本算法领域内的技术手册,涵盖数十种算法,不仅使读者深入了解各类算法的基本理论,还从应用的角度为读者提供大量实例,使读者能够快速、高效进阶各类算法,并能够熟练应用到将来的工作实践中。
本书特色
本书不仅将目前工程应用中主流的基础算法和机器学习算法都做了详尽的介绍,还囊括了当前热门算法内容,如分类算法、聚类算法、推荐算法等。本书充分利用了最新算法的应用研究结果,从实例的角度为读者展现一个清晰的算法应用,不拘泥于算法枯燥的理论,更多地从实用价值、工程价值的角度呈现给读者。
本书中的算法可以广泛应用于各个领域,可以在自然语言处理研究、数据分析与挖掘、商务智能、广告与商品推荐等领域中深入应用。作者秉承数据结合算法产生价值的理论体系,在介绍算法的同时与数据紧密关联,并结合多年实际工作经验,将算法的内容阐述淋漓尽致。本书中的算法研究在当前甚至未来相当一段时间内都具有很高的实际意义。
本书结构
本书按照由浅入深、循序渐进的顺序对现代搜索引擎原理和实现进行介绍。全书共分为两大部分,共十个章节。第一部分主要针对基础领域算法的介绍和应用,包含第1章到第4章;第二部分主要针对机器学习领域算法的理论认识和实例解析,包含第5章到第10章。全书各章的主要内容如下。
第1章 算法基础
本章从算法的分析类型,如从分治法、动态规划、回溯法、分支限界法、贪心法,入手开始介绍算法内容,不仅如此还分析了算法的性能,并介绍了概率论与数理统计基础部分的内容。同时,还对算法中常用的距离计算算法、排序算法及字符串压缩编码也做了完整介绍。
第2章 数据查找与资源分配算法
本章以数据的查找和资源分配作为突破口,介绍了常用的数值查找算法,如二分查找算法、分块查找及哈希查找算法。除此之外,还介绍了常见的字符串查找算法及在海量数据中的查找算法:布隆过滤器和倒排索引查找。介绍了资源分配算法,包括常用的银行家算法和背包问题的解决算法。
第3章 路径分析算法
本章介绍的内容主要集中在路径规划算法上,包括基于Dijkstra算法、Floyd算法、A*算法的路径分析方法。除了介绍传统的路径规划算法外,还介绍了维特比算法在概率中的路径选择,以及最长公共子串、最长公共子序列问题的求解算法。整个内容涵盖了绝大部分的路径选择算法。
第4章 相似度分析算法
本章介绍的内容主要集中在相似内容的分析理论和应用,从简单的Jaccard相似系数开始入手,逐步深入到MinHash相似性算法,以及后续的向量空间模型,向量空间模型已经成为众多算法的基础理论。后续还深入介绍了余弦相似性算法和基于语义主题模型的语义相似度计算方法,以及基于SimHash的指纹码重复值验证算法。
第5章 数据分类算法
本章集中介绍了数据分类算法的解决方案,从简单易于理解的朴素贝叶斯模型开始,由浅入深地介绍AdaBoost分类器及支持向量机,它们都是数据分类的有效解决方案,还对机器学习的相关基础知识做了概要介绍。最后还介绍了K邻近算法在数据分类中的应用。
第6章 数据聚类算法
本章介绍了数据聚类的相关算法,其中,无监督的聚类算法目前是研究比较热门的领域。首先介绍了传统的基于系统聚类的方法;然后介绍了基于距离计算的K-Means聚类算法及基于密度的DBSCAN算法;最后还介绍了基于BIRCH算法的聚类分析,通过聚类特征及聚类特征实现数据聚类。
第7章 数据预测与估算算法
本章介绍了数据的预测和估算的算法体系和应用范例,从产生式模型和判别式模型入手介绍各类模型的方法论。首先介绍了基于最大似然估计的预测算法,以及基于线性回归的方法、最大期望算法;然后介绍了基于隐马尔科夫模型的问题预测模型;最后介绍了基于隐马尔科夫模型的条件随机场模型。
第8章 数据决策分析算法
本章对数据决策的分析方法做了详细介绍,主要围绕决策树的理论基础展开介绍。首先介绍了基于ID3算法的决策树分析,包括信息熵、信息增益等;然后介绍了基于ID3算法扩展的C4.5算法及分类回归树模型;最后还介绍了随机森林在决策分类中的应用。介绍过程中包含了大量实例。
第9章 数据关联规则分析算法
本章主要介绍了关联规则分析方法的理论和实践。Apriori算法作为最常用的关联规则分析算法已经被广泛应用到各个领域,本章也对Apriori算法进行了深入的介绍,并对和Apriori算法同等重要的FP-Growth算法也通过实例做了详细介绍。本章最后还介绍了利用倒排文件思想的Eclat算法。
第10章 数据与推荐算法
本章主要介绍了数据与推荐算法中的应用关系,推荐算法作为目前各行各业最热门的算法之一,已经应用非常广泛。本章介绍了基于物品本身属性关系的Item-Based协同过滤推荐算法,以及基于人群的User-Based协同过滤推荐算法。除此之外,还介绍了基于流行度和潜在因子的推荐算法,以及推荐算法的效果评估相关内容。
本书通过对数据与算法相关理论介绍和应用,将理论和实际应用结合,并阐述了各个算法的应用场景及算法复杂度,使读者对算法的理解不仅停留在表面。由浅入深地将基础算法和机器学习算法成熟应用到各个领域,达到游刃有余的状态。但因为每个算法都存在一定的缺点,所以希望读者能充分了解、掌握各个算法,将算法的作用发挥到极致。
除此之外,读者也能够从本书中快速、高效地从大量数据中找出所需要的数据或其他信息,这在大数据时代起到了非常重要的作用,给读者带来极大的便利。
读者对象
? 适合对基本算法和机器学习算法有兴趣的读者。
? 适合于对数据分析和统计学有兴趣的读者。
? 适合于对算法有研究的基础算法、机器学习工程师。
? 适合互联网行业的不同层次从业者。
? 适合于在校学习的软件或计算机专业的大学生。

目录

目录 阅读
第1章 算法基础
第2章 数据查找与资源分配算法
第3章 路径分析算法
第4章 相似度分析算法
第5章 数据分类算法
第6章 数据聚类算法
第7章 数据预测与估算算法
第8章 数据决策分析算法
第9章 数据关联规则分析算法
第10章 数据与推荐算法

读者评论

  • 比较简单

    bokoder发表于 2021/4/30 12:28:21
  • 这个书籍有示例代码吗

    pkzikao发表于 2018/4/23 11:18:10
  • 学校正在发展人工智能,筹建AI教研室,希望有机会能学习和交流。

    xw7932发表于 2017/3/18 21:20:23
  • 666

    syhdha发表于 2017/3/17 12:06:32

相关博文

  • 炎热天气看书还是钓鱼?隐马尔科夫模型教你预测!

    炎热天气看书还是钓鱼?隐马尔科夫模型教你预测!

    管理员账号 2017-02-16

    小编说:隐马尔科夫模型(Hide Markov Model)是一种概率统计模型,非常适合用于有未知条件的问题。气候变化万千,我们的行动也会因天气不同而改变,那么在不清楚天气状况的情况下,如何预测未来几天我们的行动呢?本文选自《大数据时代...

    管理员账号 2017-02-16
    764 0 0 0

相关图书

AI魔法绘画:用Stable Diffusion挑战无限可能

陈然 (作者)

本书以实际操作为导向,详细讲解基于Stable Diffusion进行AI绘画的完整学习路线,包括绘画技巧、图片生成、提示词编写、ControlNet插件、模型...

 

算法笔记(第2版)

刁瑞 谢妍 (作者)

ChatGPT掀起了现象级的风暴,赶超ChatGPT潮流,算法突破是关键。 本书介绍了若干常见算法,涉及排序、哈希、动态规划与近似算法、高斯消去法、图论与线性...

 

算法训练营:海量图解+竞赛刷题(入门篇)

陈小玉 (作者)

本书以海量图解的形式,详细讲解常用的数据结构与算法,又融入大量的竞赛实例和解题技巧。通过对本书的学习,读者可掌握12种初级数据结构、15种常用STL函数、10种...

 

算法训练营:海量图解+竞赛刷题(进阶篇)

陈小玉 (作者)

本书以海量图解的形式,详细讲解常用的数据结构与算法,并结合竞赛实例引导读者进行刷题实战。通过对本书的学习,读者可掌握22种高级数据结构、7种动态规划算法、5种动...

 

Unreal Engine 4可视化设计:交互可视化、动画与渲染开发绝艺

Tom Shannon (作者) 龚震宇 (译者)

Shannon回答了有关UE4可视化问题的常见问题,解决了从数据导入和处理到照明、高级材料和渲染等问题。他揭示了UE4与传统渲染系统重要的不同之处,即使它们使用...

 

程序员的AI书:从代码开始

张力柯 潘晖 (作者)

随着AI技术的普及,如何快速理解、掌握并应用AI技术,成为绝大多数程序员亟需解决的问题。本书基于Keras框架并以代码实现为核心,详细解答程序员学习AI算法时的...

¥76.30