Druid 作为一款开源的实时大数据分析软件,最近几年快速风靡全球互联网公司,特别是对于海量数据和实时性要求高的场景,包括广告数据分析、用户行为分析、数据统计分...
数据分析行业就像所有新兴行业初期一样,伴随着混乱和盲目,一方面市场上培训机构巧立名目颁发证书,另一方面也有许多国外的著作被生搬硬套过来供自学者学习。本书是第一本...
HDFS是运行在通用硬件上的分布式文件系统,本书详细介绍了HDFS体系结构、基本概念、通信协议及主要流程,具体包括Hadoop RPC框架的使用及实现、文件系统...
随着大数据分析方法的发展,分析工具的改进,大数据分析的门槛降低了。基于大数据算法平台,数据分析师们已经不再被数据的“大”所困扰,可以轻松地探索大数据,挖掘大数据...
大数据时代,数据的价值愈加重要,数据在经历了数据获取、数据挖掘、数据展示三个主要阶段后直面用户。数据可视化处于这条生产链的下游,控制着数据对用户的输出,它的优劣...
《Scala集合技术手册》是首部全面介绍Scala集合框架的图书,它基于最新的Scala 2.11编写,深入全面地介绍了Scala集合框架的集合类和方法,通过图...
“三分虚拟化技术、七分分布式管理、十二分大数据”将是企业在大数据时代下的信息化建设指导思想。作者遵循这一思想,重点阐述了企业如何利用开源的大数据相关产品来进行企...
从源码级别深度剖析当下大数据领域最为红火的Apache Spark,分析紧密围绕两大维度展开:一是从Hadoop生态圈的角度来看Spark为什么能取得当前这么大...
随着大数据需求和使用模式的扩大,Hadoop已暴露出诸多局限性,特别是越来越多的组织需要对大数据进行实时的、迭代式和交互式的分析和挖掘。本书将介绍如何用Spar...
3是当前流行的用于数据可视化开发的 JavaScript 函数库,可用其制作交互式图表。 本书由浅入深,包含以下三大部分: 一、基础知识。本部分主要阐述选择...
在本书中主要是介绍数据分析的一系列工具的应用,如:Excel、LINGO、Crystal Ball、JMP、Minitab、Xcelsius等,涉及的分析有预测...
大数据是当前最为流行的热点概念之一,其已由技术名词衍生到对很多行业产生颠覆性影响的社会现象,作为最明确的技术发展趋势之一,基于大数据的各种新型产品必将会对每个人...
本书是斯坦福大学信息检索和挖掘课程的首选教材之一,并已成为全球主要大学信息检索的主要教材。本书理论和实践并重,深入浅出地给出了海量信息数据处理的整套解决方案,包...