本书是涵盖Apache Kafka各方面的具有实践指导意义的工具书和参考书。作者结合典型的使用场景,对Kafka整个技术体系进行了较为全面的讲解,以便读者能够举...
从源码级别深度剖析当下大数据领域最为红火的Apache Spark,分析紧密围绕两大维度展开:一是从Hadoop生态圈的角度来看Spark为什么能取得当前这么大...
HDFS是运行在通用硬件上的分布式文件系统,本书详细介绍了HDFS体系结构、基本概念、通信协议及主要流程,具体包括Hadoop RPC框架的使用及实现、文件系统...
在互联网+时代,数据是炙手可热的重要资源,网络使用基础的提升,数据流量增大,用户需求多样化和多变对架构设计提出严峻考验,而Hadoop为快速响应用户需求提供了重...
本书针对Hadoop的复杂技术,提供给读者100个实战案例,帮助读者更好地运用Hadoop。书中案例一步步地深入探讨了在技术中遇到的实际问题。不仅传授读者如何建...
《Spark GraphX实战》是一本Spark GraphX入门书籍。前5章为基础内容,即使读者对Spark、GraphX、Scala不熟悉,也能快速上手;后...
本书以Spark 1.4.1版本源码为切入点,全面并且深入地解析Spark MLlib模块,着力于探索分布式机器学习的底层实现。<br> 本书循序渐进,首...
本书针对spark从验证性环境迁移到实际生产环境时会遇到的各种问题给出了实际的帮助,涵盖了开发及维护生产级Spark应用的各种方法、组件与有用实践。全书分为6章...
随着大数据需求和使用模式的扩大,Hadoop已暴露出诸多局限性,特别是越来越多的组织需要对大数据进行实时的、迭代式和交互式的分析和挖掘。本书将介绍如何用Spar...
本书介绍了Java EE领域的全新开源框架:Spring Boot。其中Spring的版本为5.0。本书的示例建议在Tomcat 8上运行。<br>本书重点介绍...
本书主要介绍介绍了Java EE领域的两个开源框架:Spring的MVC和MyBatis。其中Spring的版本为5.0,MyBatis的版本是3.4.5。本书...
数据开发能力已成为企业核心竞争力。到底什么样的工具才能帮助企业与客户需求建立联系? 读者可以从本书中找到满意的答案。本书最大特点是指导读者用Ruby, Pyth...
本书是《轻量级Java EE企业应用实战》的第5版,这一版保持了前几版内容全面、深入的特点,主要完成全部知识的升级。<br>本书介绍了Java EE领域的四个开...
本书以Spark 2.0 版本为基础进行编写,全面介绍了Spark 核心及其生态圈组件技术。主要内<br>容包括Spark 生态圈、实战环境搭建、编程模型和内部...
本书首先介绍了Hadoop的背景知识,包括Hadoop 2和YARN的工作原理和对Hadoop 1的改进,然后将数据湖与传统存储比较。第2章到第8章,分别介绍了...