大数据时代的算法:机器学习、人工智能及其典型实例
  • 推荐0
  • 收藏8
  • 浏览2.7K

大数据时代的算法:机器学习、人工智能及其典型实例

刘凡平 , 张启玉 , 刘刚 (作者) 

  • 书  号:978-7-121-30429-3
  • 出版日期:2017-01-06
  • 页  数:220
  • 开  本:16(185*235)
  • 出版状态:上市销售
  • 维护人:张月萍

相关图书

强化学习实战:强化学习在阿里的技术演进和业务创新

笪庆 曾安祥 (作者)

近年来,随着与深度神经网络的结合,强化学习在以Atari2600和围棋为代表的游戏领域取得了突破性的进展。与学术界关注的方向不同,在阿里巴巴,我们则将重点放在推...

 

程序员编程指南

安晓辉 (作者)

本书是专为程序员而编写的。全书浅显易懂,深入浅出,书中从各个角度,全面地解读了程序员这个特定人群,在日常程序设计工作中遇到的种种问题及解决办法,如何设计代码,如...

¥59.80

相关性搜索:利用Solr与Elasticsearch创建智能应用

Doug Turnbull John Berryman (作者) 莫映 蔡宇飞 殷志勇 (译者)

本书揭开了相关性搜索的神秘面纱,告诉大家如何将 Elasticsearch与 Solr这样的搜索引擎作为可编程的相关性框架,从而表达业务排名规则。从这本书中你可...

 

机器学习之路——Caffe、Keras、scikit-learn实战

阿布 胥嘉幸 (作者)

机器学习需要一条脱离过高理论门槛的入门之路。<br>本书《机器学习篇》从小红帽采蘑菇的故事开篇,介绍了基础的机器学习分类模型的训练(第1章)。如何评估、调试模型...

¥79.00

快学Scala(第2版)

Cay S. Horstmann (作者) 高宇翔 (译者)

Scala是一门主要以Java虚拟机(JVM)为目标运行环境并将面向对象和函数式编程语言的最佳特性结合在一起的编程语言。你可以使用Scala编写出更加精简的程序...

¥108.00

深度学习算法实践

吴岸城 (作者)

本书以一位软件工程师的转型故事为线索,讲述算法思维的建立及实践。第1章主要讲解如何从传统的工程思维转入算法思维,第2-5章分别阐述文本处理、视觉识别、Bot机器...

¥79.00
本书介绍在互联网行业中经常涉及的算法,包括排序算法、查找算法、资源分配算法、路径分析算法、相似度分析算法,以及与机器学习相关的算法,包括数据分类算法、聚类算法、预测与估算算法、决策算法、关联规则分析算法及推荐算法。本书涉及的相关算法均为解决实际问题中的主流算法,对于工作和学习都有实际参考意义。
本书是一本算法领域内的技术参考书籍,涵盖数十种算法,通过由浅入深的介绍基础算法和机器学习算法相关理论和应用,阐述了各个算法的应用场景及算法复杂度,使读者对算法的理解不只是停留在表面,还从应用的角度提供了大量实例,使读者能够快速、高效进阶各类算法,并能够熟练应用到将来的工作实践中。

大数据时代,只有算法能洞悉数据的内在逻辑,让数据产生商业价值!
致 谢
本书的内容来自于我对日常学习和工作的总结,我要感谢本人曾经的导师于炯教授、叶勇教授,以及在微软和百度工作时的前辈王明雨、何绍建、黄诚,正是你们对我的悉心指导,才能使我有能力和勇气写出这本书,无论你们在哪里,凡平永远心存感激。当然还有那些曾经一起学习的同学、共事的朋友,你们曾经给予我很多无私的帮助,使我在和你们相处的过程中能够快速成长,感谢一路上有你们的陪伴,正是有你们,沿途的风景才格外美丽。
感谢英国的Peter Boden先生,虽然我们素未谋面,但是你却一直支持我们团队去实现自己的梦想,并连续两年无偿支持我们在Github开源社区的项目。在开源项目中,我们实现了不少有一定难度的算法,如果没有你的支持,也许我们不能正常完成相关的研发任务,更不可能去挑战搜索引擎中各类算法,尤其在人工智能领域的算法,对你的感激之情溢于言表。
感谢我的创业伙伴魏琪,当我提出我们一起研究人工智能技术时,你毫不犹豫地选择了和我一起艰苦创业。无论处在创业的何种困难期,你总是为团队加鼓气,你踏实和认真的工作态度让我钦佩不已,感谢你为本书的技术细节提出了真知灼见的修改意见,还有我一起工作的同学和朋友都对本书提出了改进意见,对此也表示深深的感谢。
感谢北京源智天下公司的吉老师及电子工业出版社的各位编辑,对本书的内容都给予了极大的帮助,对本书的出版也付出了辛苦汗水。
衷心感谢我的家人,感谢你们在过去一年中对我的理解和支持,为我营造了一个良好的写作环境,并鼓励我坚持认真写作,使本书能够顺利完成。
本书编写过程中还得到了很多朋友的支持和帮助,限于篇幅,虽然不能一一对你们表示感谢,但是我对你们一样表示感激。
最后,感谢这个时代给予每位有理想的人,赋予实现人生价值的机会!



前 言
中国在很早就开始了算法研究,如《周髀算经》、《九章算术》这类最具历史的算法书籍,以及后来的唐宋元明清各历史朝代也出现了如《一位算法》、《算法绪论》、《算法全书》、《算法统宗》等一系列算法名著,算法已经成为各行各业的基础研究。
本书通过介绍在互联网行业中经常涉及的算法包括排序算法、查找算法、资源分配算法、路径分析算法、相似度分析算法,以及与机器学习相关的算法包括分类算法、聚类算法、预测与估算算法、决策算法、关联规则分析算法及推荐算法。本书是一本算法领域内的技术手册,涵盖数十种算法,不仅使读者深入了解各类算法的基本理论,还从应用的角度为读者提供大量实例,使读者能够快速、高效进阶各类算法,并能够熟练应用到将来的工作实践中。
本书特色
本书不仅将目前工程应用中主流的基础算法和机器学习算法都做了详尽的介绍,还囊括了当前热门算法内容,如分类算法、聚类算法、推荐算法等。本书充分利用了最新算法的应用研究结果,从实例的角度为读者展现一个清晰的算法应用,不拘泥于算法枯燥的理论,更多地从实用价值、工程价值的角度呈现给读者。
本书中的算法可以广泛应用于各个领域,可以在自然语言处理研究、数据分析与挖掘、商务智能、广告与商品推荐等领域中深入应用。作者秉承数据结合算法产生价值的理论体系,在介绍算法的同时与数据紧密关联,并结合多年实际工作经验,将算法的内容阐述淋漓尽致。本书中的算法研究在当前甚至未来相当一段时间内都具有很高的实际意义。
本书结构
本书按照由浅入深、循序渐进的顺序对现代搜索引擎原理和实现进行介绍。全书共分为两大部分,共十个章节。第一部分主要针对基础领域算法的介绍和应用,包含第1章到第4章;第二部分主要针对机器学习领域算法的理论认识和实例解析,包含第5章到第10章。全书各章的主要内容如下。
第1章 算法基础
本章从算法的分析类型,如从分治法、动态规划、回溯法、分支限界法、贪心法,入手开始介绍算法内容,不仅如此还分析了算法的性能,并介绍了概率论与数理统计基础部分的内容。同时,还对算法中常用的距离计算算法、排序算法及字符串压缩编码也做了完整介绍。
第2章 数据查找与资源分配算法
本章以数据的查找和资源分配作为突破口,介绍了常用的数值查找算法,如二分查找算法、分块查找及哈希查找算法。除此之外,还介绍了常见的字符串查找算法及在海量数据中的查找算法:布隆过滤器和倒排索引查找。介绍了资源分配算法,包括常用的银行家算法和背包问题的解决算法。
第3章 路径分析算法
本章介绍的内容主要集中在路径规划算法上,包括基于Dijkstra算法、Floyd算法、A*算法的路径分析方法。除了介绍传统的路径规划算法外,还介绍了维特比算法在概率中的路径选择,以及最长公共子串、最长公共子序列问题的求解算法。整个内容涵盖了绝大部分的路径选择算法。
第4章 相似度分析算法
本章介绍的内容主要集中在相似内容的分析理论和应用,从简单的Jaccard相似系数开始入手,逐步深入到MinHash相似性算法,以及后续的向量空间模型,向量空间模型已经成为众多算法的基础理论。后续还深入介绍了余弦相似性算法和基于语义主题模型的语义相似度计算方法,以及基于SimHash的指纹码重复值验证算法。
第5章 数据分类算法
本章集中介绍了数据分类算法的解决方案,从简单易于理解的朴素贝叶斯模型开始,由浅入深地介绍AdaBoost分类器及支持向量机,它们都是数据分类的有效解决方案,还对机器学习的相关基础知识做了概要介绍。最后还介绍了K邻近算法在数据分类中的应用。
第6章 数据聚类算法
本章介绍了数据聚类的相关算法,其中,无监督的聚类算法目前是研究比较热门的领域。首先介绍了传统的基于系统聚类的方法;然后介绍了基于距离计算的K-Means聚类算法及基于密度的DBSCAN算法;最后还介绍了基于BIRCH算法的聚类分析,通过聚类特征及聚类特征实现数据聚类。
第7章 数据预测与估算算法
本章介绍了数据的预测和估算的算法体系和应用范例,从产生式模型和判别式模型入手介绍各类模型的方法论。首先介绍了基于最大似然估计的预测算法,以及基于线性回归的方法、最大期望算法;然后介绍了基于隐马尔科夫模型的问题预测模型;最后介绍了基于隐马尔科夫模型的条件随机场模型。
第8章 数据决策分析算法
本章对数据决策的分析方法做了详细介绍,主要围绕决策树的理论基础展开介绍。首先介绍了基于ID3算法的决策树分析,包括信息熵、信息增益等;然后介绍了基于ID3算法扩展的C4.5算法及分类回归树模型;最后还介绍了随机森林在决策分类中的应用。介绍过程中包含了大量实例。
第9章 数据关联规则分析算法
本章主要介绍了关联规则分析方法的理论和实践。Apriori算法作为最常用的关联规则分析算法已经被广泛应用到各个领域,本章也对Apriori算法进行了深入的介绍,并对和Apriori算法同等重要的FP-Growth算法也通过实例做了详细介绍。本章最后还介绍了利用倒排文件思想的Eclat算法。
第10章 数据与推荐算法
本章主要介绍了数据与推荐算法中的应用关系,推荐算法作为目前各行各业最热门的算法之一,已经应用非常广泛。本章介绍了基于物品本身属性关系的Item-Based协同过滤推荐算法,以及基于人群的User-Based协同过滤推荐算法。除此之外,还介绍了基于流行度和潜在因子的推荐算法,以及推荐算法的效果评估相关内容。
本书通过对数据与算法相关理论介绍和应用,将理论和实际应用结合,并阐述了各个算法的应用场景及算法复杂度,使读者对算法的理解不仅停留在表面。由浅入深地将基础算法和机器学习算法成熟应用到各个领域,达到游刃有余的状态。但因为每个算法都存在一定的缺点,所以希望读者能充分了解、掌握各个算法,将算法的作用发挥到极致。
除此之外,读者也能够从本书中快速、高效地从大量数据中找出所需要的数据或其他信息,这在大数据时代起到了非常重要的作用,给读者带来极大的便利。
读者对象
? 适合对基本算法和机器学习算法有兴趣的读者。
? 适合于对数据分析和统计学有兴趣的读者。
? 适合于对算法有研究的基础算法、机器学习工程师。
? 适合互联网行业的不同层次从业者。
? 适合于在校学习的软件或计算机专业的大学生。

目录

目录 阅读
第1章 算法基础
第2章 数据查找与资源分配算法
第3章 路径分析算法
第4章 相似度分析算法
第5章 数据分类算法
第6章 数据聚类算法
第7章 数据预测与估算算法
第8章 数据决策分析算法
第9章 数据关联规则分析算法
第10章 数据与推荐算法

读者评论

  • 这个书籍有示例代码吗

    pkzikao发表于 2018/4/23 11:18:10
  • 学校正在发展人工智能,筹建AI教研室,希望有机会能学习和交流。

    xw7932发表于 2017/3/18 21:20:23
  • 666

    syhdha发表于 2017/3/17 12:06:32

相关博文

  • 炎热天气看书还是钓鱼?隐马尔科夫模型教你预测!

    炎热天气看书还是钓鱼?隐马尔科夫模型教你预测!

    管理员账号 2017-02-16

    小编说:隐马尔科夫模型(Hide Markov Model)是一种概率统计模型,非常适合用于有未知条件的问题。气候变化万千,我们的行动也会因天气不同而改变,那么在不清楚天气状况的情况下,如何预测未来几天我们的行动呢?本文选自《大数据时代...

    管理员账号 2017-02-16
    169 0 0 0