本书是从理论到实践的全面且细致的企业数据驱动指南,从作者的百度大数据工作说起,完整还原其从零到一构建百度用户行为大数据处理平台经历。详解大数据本质、理念与现状,...
本书是由人工智能一线从业专家根据自己日常工作的体会与经验总结而成的,在对TensorFlow的基础知识、环境搭建、神经网络、常用技术的详细讲解当中穿插了自己实战...
本书是斯坦福大学信息检索和挖掘课程的首选教材之一,并已成为全球主要大学信息检索的主要教材。本书理论和实践并重,深入浅出地给出了海量信息数据处理的整套解决方案,包...
“三分虚拟化技术、七分分布式管理、十二分大数据”将是企业在大数据时代下的信息化建设指导思想。作者遵循这一思想,重点阐述了企业如何利用开源的大数据相关产品来进行企...
数据开发能力已成为企业核心竞争力。到底什么样的工具才能帮助企业与客户需求建立联系? 读者可以从本书中找到满意的答案。本书最大特点是指导读者用Ruby, Pyth...
R是一种可用于统计计算和作图的编程语言及环境,可提供广泛的统计(例如,时间序列分析、线性及非线性建模、经典的统计检验)及作图技术,并且具有高度的扩展性。本书中以...
大数据是当前最为流行的热点概念之一,其已由技术名词衍生到对很多行业产生颠覆性影响的社会现象,作为最明确的技术发展趋势之一,基于大数据的各种新型产品必将会对每个人...
随着大数据需求和使用模式的扩大,Hadoop已暴露出诸多局限性,特别是越来越多的组织需要对大数据进行实时的、迭代式和交互式的分析和挖掘。本书将介绍如何用Spar...
从源码级别深度剖析当下大数据领域最为红火的Apache Spark,分析紧密围绕两大维度展开:一是从Hadoop生态圈的角度来看Spark为什么能取得当前这么大...
在本书中主要是介绍数据分析的一系列工具的应用,如:Excel、LINGO、Crystal Ball、JMP、Minitab、Xcelsius等,涉及的分析有预测...
3是当前流行的用于数据可视化开发的 JavaScript 函数库,可用其制作交互式图表。 本书由浅入深,包含以下三大部分: 一、基础知识。本部分主要阐述选择...
深入浅出地讲述了在“数据为王”的时代下,统计作为分析、解读数据的学科,如何为商业、社会、生活等领域提供决策支持。第一章概述了大数据时代统计学面临的机遇和挑战。第...
本书对Tableau的产品、优势、Tableau 9.0的新特性及其功能做了全面的介绍,并且从十五个不同行业的案例入手,让你在阅读本书后能够从一个新手成长为能够...
大数据时代,掌控数据首先需要掌握数据的处理能力。俗话说,“工欲善其事,必先利其器”。Informatica PowerCenter作为业界广泛使用的数据处理工具...
面向电商企业的运营人员,数据分析人员,针对淘宝、天猫做SEO优化时,SEO优化所涉及到的十几个优化参数,例如:上下架时间、DSR动态得分、30天销量等等这些公开...
大数据时代,数据的价值愈加重要,数据在经历了数据获取、数据挖掘、数据展示三个主要阶段后直面用户。数据可视化处于这条生产链的下游,控制着数据对用户的输出,它的优劣...
HDFS是运行在通用硬件上的分布式文件系统,本书详细介绍了HDFS体系结构、基本概念、通信协议及主要流程,具体包括Hadoop RPC框架的使用及实现、文件系统...
大数据是互联网、移动应用、社交网络和物联网等技术发展的必然趋势,大数据应用成为当前最为热门的信息技术应用领域。本书由浅入深,首先概述性地分析了大数据的发展背景、...
随着大数据分析方法的发展,分析工具的改进,大数据分析的门槛降低了。基于大数据算法平台,数据分析师们已经不再被数据的“大”所困扰,可以轻松地探索大数据,挖掘大数据...
《Scala集合技术手册》是首部全面介绍Scala集合框架的图书,它基于最新的Scala 2.11编写,深入全面地介绍了Scala集合框架的集合类和方法,通过图...