大数据处理之道
  • 推荐0
  • 收藏0
  • 浏览1.3K

大数据处理之道

何金池 (作者) 

  • 丛  书:大数据丛书
  • 书  号:978-7-121-28723-7
  • 出版日期:2016-09-21
  • 页  数:284
  • 开  本:16(170*240)
  • 出版状态:上市销售
  • 维护人:刘皎
本书覆盖了当前大数据处理领域的热门技术,包括Hadoop、Spark、Storm、Dremel、Drill等,详细分析了各种技术的应用场景和优缺点;同时阐述了大数据下的日志分析系统,重点讲解了ELK日志处理方案;最后分析了大数据处理技术的发展趋势。
本书采用幽默的表述风格,使读者容易理解、轻松掌握;重点从各种技术的起源、设计思想、架构等方面阐述,以帮助读者从根源上悟出大数据处理之道。
前言
近年来,“大数据”已然成为IT界如火如荼的词,与“云计算” 并驾齐驱,成为带动IT行业发展的两列高速火车。尤其是在物联网快速发展的时代,数据已经被称为新的资源,是支撑物联网发展的基石。
那么,如何把“死”的数据变成真正有效的“资源”,成为近年来IT界人士共同思考的问题。一时间,各种大数据处理技术如井喷一般涌现。Hadoop、 Spark、Storm、Dremel、Drill等大数据解决方案争先恐后地展现出来。需要说明的是,这里所有的方案并不是一种技术,而是数种甚至数十种技术的组合。就拿Hadoop来说,Hadoop只是“领头羊”,关键成员还有MapReduce、HDFS、Hive、HBase、Pig、ZooKeeper等,大有“八仙过海,各显神通”的气势和场面。
本书首先横向总结性地阐述了各种大数据处理技术,重点从缘起缘落、设计思想、架构原理等角度剖析了各种技术,分析了各种技术的优缺点和适用场景。本书并不涉及软件的安装等,因为如何安装和使用,在网络上搜索即可,着实没有必要浪费读者的时间和金钱。在这一部分,第1篇为Hadoop军营;第2篇为Spark星火燎原;第3篇讲述了其他大数据处理技术,如Storm、Dremel、Drill等。
其次阐述了大数据下的日志分析技术。在大数据时代,日志分析方案呈现出遍地开花的景象。如果将大数据处理系统比作一个可能得病的人,那么日志分析就是负责看病的医生,要想让大数据处理系统健康、平稳地运行,日志分析和监控非常重要。这一部分重点阐述了日志分析技术中如日中天的方案ELK。
最后展望了大数据处理技术的发展趋势。大数据处理技术发展迅猛,数据量越来越大,技术的革新在所难免。
作为大数据研发人员,只有时刻学习新技术,方能立于技术前沿。
由于时间仓促,书中难免出现不足之处,恳请读者指正。本书编写过程中得到了团队其他成员的支持,贡献力量的有张帅、王占伟、李峰、欧立奇等,在此衷心感谢朋友和家人的鼎力支持。
闲言少叙,直接上干货吧!亲爱的读者朋友,请吧……

目录

目录 阅读
第1篇 Hadoop军营
第1章 Hadoop一石激起千层浪
第2章 MapReduce奠定基石
第3章 分布式文件系统
第4章 Hadoop体系的“四剑客”
第5章 Hadoop资源管理与调度
第6章 Hadoop集群管理之道
第2篇 Spark星火燎原
第7章 Spark宝刀出鞘
第8章 Spark核心RDD
第9章 Spark运行模式和流程
第10章 Shark和Spark SQL
第11章 Spark Streaming流数据处理新贵
第12章 Spark Grahx图计算系统
第13章 Spark Cluster管理
第3篇 其他大数据处理系统
第14章 专为流数据而生的Storm
第15章 Dremel和Drill
第4篇 大数据下的日志分析系统
第16章 日志分析解决方案
第17章 ELK集群部署与应用
第5篇 数据分析技术前景展望
第18章 大数据处理的思考与展望

读者评论

电子书版本

  • Epub
  • Mobi

相关博文

  • Spark 和 Hadoop MapReduce 对比

    管理员账号 2016-10-24

    小编说:一提到大数据处理,相信很多人第一时间想到的是 Hadoop MapReduce。没错,Hadoop MapReduce 为大数据处理技术奠定了基础。近年来,随着 Spark 的发展,越来越多的声音提到了 Spark。而Spark...

    管理员账号 2016-10-24
    2101 2 2 0

同系列书

  • 企业数据化管理变革——数据治理与统筹方案

    赵兴峰 (作者)

    很多企业热衷于谈论大数据,却忽视企业内部的基础数据管理以及内部管理团队的数据思维训练。不重视数据,就不会有数据;没有数据、没有具备数据思维的管理团队,大数据跟你...

    ¥59.00
  • 解析深度学习:语音识别实践

    俞凯等 俞栋 邓力 (作者) 俞凯 (译者)

    本书是首部介绍语音识别中深度学习技术细节的专著。全书首先概要介绍了传统语音识别理论和经典的深度神经网络核心算法。接着全面而深入地介绍了深度学习在语音识别中的应用...

    ¥109.00
  • 金融大数据:战略规划与实践指南

    陈利强 (作者)

    从金融与大数据的天然联系展开,阐述了金融行业实施大数据战略的必要性以及优势。冷静、客观的从数据角度分析了金融行业如何基于自身的特点来搭建大数据的环境,打通业务环...

    ¥79.00
  • 发现数据之美:数据分析原理与实践

    彭鸿涛 (作者)

    本书试图全面介绍IBM SPSS在构建基于数据深度分析的行业解决方案方面的预测 分析功能,试图涵盖统计分析、数据挖掘和决策管理三个方面的内容。IBM SPSS...

    ¥75.00
  • 数据可视化(全彩)

    陈为 (作者)

    可视化是数据分析处理的重要手段。国内迄今尚无一本原创的数据可视化教材。 本书的内容将以归纳介绍核心的数据可视化原理为主,每章添加一个小章节总结最新研究进展(作...

    ¥128.00

相关图书

Unreal Engine 4可视化设计:交互可视化、动画与渲染开发绝艺

Tom Shannon (作者) 龚震宇 (译者)

Shannon回答了有关UE4可视化问题的常见问题,解决了从数据导入和处理到照明、高级材料和渲染等问题。他揭示了UE4与传统渲染系统重要的不同之处,即使它们使用...

 

虫术——Python绝技

梁睿坤 (作者)

本书以大数据应用方面常用的语言Python为基础,从网络爬虫的实现原理入手,逐步引领读者进入网络爬虫的世界。在各类爬虫框架中,将Scrapy作为轴心,从多个维度...

¥99.00

Scala高性能编程

Vincent Theron (作者) 杨云 (译者)

Scala是一种表达能力非常强的语言,能够用非常简洁的代码表达丰富的业务含义。为了在生产上充分发挥Scala的能力,除了掌握其简洁的语法外,理解Scala在性能...

¥69.00

网络爬虫全解析——技术、原理与实践

罗刚 (作者)

本书介绍了如何开发网络爬虫。内容主要包括开发网络爬虫所需要的Java语法基础和网络爬虫的工作原理,如何使用开源组件HttpClient和爬虫框架Crawler4...

¥49.00

全栈数据之门

任柳江 (作者)

本书以数据分析领域最热的Python语言为主要线索,介绍了数据分析库numpy、Pandas与机器学习库scikit-learn,使用了可视化环境Orange ...

¥49.00

Druid实时大数据分析原理与实践

欧阳辰 刘麒贇 张海雷 高振源 许哲 (作者)

Druid 作为一款开源的实时大数据分析软件,最近几年快速风靡全球互联网公司,特别是对于海量数据和实时性要求高的场景,包括广告数据分析、用户行为分析、数据统计分...

¥59.00