大数据架构详解:从数据获取到深度学习
  • 推荐0
  • 收藏2
  • 浏览2.9K

大数据架构详解:从数据获取到深度学习

朱洁 (作者) 

  • 书  号:978-7-121-30000-4
  • 出版日期:2016-10-12
  • 页  数:372
  • 开  本:16(185*235)
  • 出版状态:上市销售
  • 维护人:安娜
全书分为三部分:一、从数据的产生、采集、计算、消费、数据端到端的角度介绍大数据技术起源、发展、关键技术点和未来趋势、业界最新产品,以及学术界最新研究方向和成果。二、介绍大数据电信领域业务,理解数据的使用方式,以及大数据的真正价值。对大数据的业务理解和构建帮助很大。三、用成功的案例介绍大数据使用经验。总的来说,一本从架构、业务、大数据实际案例深入浅出介绍大数据和Hadoop技术的书。
从真正的一个大数据企业架构对技术抽丝剥茧。关键技术讲透,明白技术的来龙去脉,掌握技术的发展趋势。是真正的实践经验,不停留在纸面上的知识,无论是有工作经验的人和初入门的读者非常有帮助和启发。
朱洁 ,2008年加入华为,具有8年大数据研发管理经验,现任华为大数据服务首席规划师。专注于大数据服务平台建设、规划和实践应用,同时参与多项企业级大数据项目解决方案的规划、设计和实施工作,在深化大数据行业落地方面有诸多实践经验,对解读大数据垂直行业的技术创新与开发有诸多独到的见解和心得。

罗华霖,2002年加入华为,华为大数据首席规划师,主导完成华为大数据平台DataSight
和华为电信大数据解决方案SmartCare技术规划和架构设计,支持电信运营商数字化战略转型,完成浙江移动、上海联通、沙特STC等200+电信大数据解决方案项目落地。曾任华为软交换首席设计师,华为大型电信大数据解决方案SmartCare首席架构师。
前 言
大数据这几年真的很火,于是有越来越多的人开始学习大数据技术。很多人会误以为大数据是一门技术,其实不然,大数据更多的是一门市场宣传语言,也可以理解为一种思考方式。从技术角度来看,大数据是一系列技术的组合,所以真正全面掌握大数据技术也是一件很困难的事情。编写这本书的初衷就是总结这些年的工作和学习经验,希望可以分享给更多人,同时对自己而言也是一个提高、总结和升华的过程。
总的来说,本书围绕一个通用技术栈来组织章节,主要聚焦大数据平台的一些知识。主要分为三部分。
第一部分:第1~3章,主要讲述大数据的本质、运营商大数据的架构和一些基本的业务知识。
 第1章:阐述大数据的本质和面临的挑战。
 第2章:概述大数据架构及背后的驱动因素,以及未来发展的趋势。
 第3章:介绍运营商领域的业务,让读者对大数据能做什么有一个直观的感受。
第二部分:第4~11章,围绕大数据平台技术栈来阐述数据获取、处理、分析和应用平台涉及的技术。
 第4章:介绍数据获取涉及的探针、爬虫、日志采集、数据分发中间件等技术。
 第5章:介绍流式数据处理引擎、CEP、流式应用。
 第6章:介绍交互式分析技术、MPP DB、热门的SQL on Hadoop技术。
 第7章:介绍批处理技术、Spark,以及大规模机器学习的BSP技术等。
 第8章:探讨机器学习、深度学习相关技术。
 第9章:统一资源管理是趋势,本章介绍资源管理的核心技术和算法。
 第10章:存储是基础,本章介绍存储的关键技术。
 第11章:探讨大数据技术怎么云化,以及关键技术是什么。
第三部分:第12章,技术和文化息息相关,技术影响文化,文化影响技术。
第12章:介绍大数据开发文化、开源、DevOps,探讨理念和文化对技术的冲击。
由于编者水平有限,书中疏漏之处在所难免,敬请谅解。
最后以乔布斯的经典名句结尾:Stay hungry,Stay foolish。

朱 洁

目录

目录 阅读
第1部分 大数据的本质
第1章 大数据是什么
第2章 运营商大数据架构
第3章 运营商大数据业务
第2部分 大数据技术
第4章 数据获取
第5章 流处理
第6章 交互式分析
第7章 批处理技术
第8章 机器学习和数据挖掘
第9章 资源管理
第10章 存储是基础
第11章 大数据云化
第12章 大数据技术开发文化
第3部分 大数据文化
第12章 大数据技术开发文化

读者评论

相关博文

  • 机器学习和数据挖掘的联系与区别

    机器学习和数据挖掘的联系与区别

    管理员账号 2016-11-09

    小编说:从数据分析的角度来看,数据挖掘与机器学习有很多相似之处,但不同之处也十分明显,例如,数据挖掘并没有机器学习探索人的学习机制这一科学发现任务,数据挖掘中的数据分析是针对海量数据进行的,等等。从某种意义上说,机器学习的科学成分更重一...

    管理员账号 2016-11-09
    2364 2 0 0

相关图书

Unreal Engine 4可视化设计:交互可视化、动画与渲染开发绝艺

Tom Shannon (作者) 龚震宇 (译者)

Shannon回答了有关UE4可视化问题的常见问题,解决了从数据导入和处理到照明、高级材料和渲染等问题。他揭示了UE4与传统渲染系统重要的不同之处,即使它们使用...

 

虫术——Python绝技

梁睿坤 (作者)

本书以大数据应用方面常用的语言Python为基础,从网络爬虫的实现原理入手,逐步引领读者进入网络爬虫的世界。在各类爬虫框架中,将Scrapy作为轴心,从多个维度...

¥99.00

Scala高性能编程

Vincent Theron (作者) 杨云 (译者)

Scala是一种表达能力非常强的语言,能够用非常简洁的代码表达丰富的业务含义。为了在生产上充分发挥Scala的能力,除了掌握其简洁的语法外,理解Scala在性能...

¥69.00

网络爬虫全解析——技术、原理与实践

罗刚 (作者)

本书介绍了如何开发网络爬虫。内容主要包括开发网络爬虫所需要的Java语法基础和网络爬虫的工作原理,如何使用开源组件HttpClient和爬虫框架Crawler4...

¥49.00

全栈数据之门

任柳江 (作者)

本书以数据分析领域最热的Python语言为主要线索,介绍了数据分析库numpy、Pandas与机器学习库scikit-learn,使用了可视化环境Orange ...

¥49.00

Druid实时大数据分析原理与实践

欧阳辰 刘麒贇 张海雷 高振源 许哲 (作者)

Druid 作为一款开源的实时大数据分析软件,最近几年快速风靡全球互联网公司,特别是对于海量数据和实时性要求高的场景,包括广告数据分析、用户行为分析、数据统计分...

¥59.00