《大数据之路2:数据更普惠,商业更智能》是《大数据之路:阿里巴巴大数据实践》的升级版,内容不再仅仅聚焦于阿里巴巴,而是延伸到对千行百业的实践与探索。本书从追溯数...
本书基于作者多年的教学与实践经验编写,重点介绍阿里云大数据体系的核心原理与架构,内容涉及开发、运维、管理与架构。全书分为4篇,共13章:第1篇(第1~2章)介绍...
《游戏数据分析:从方法到实践》由数数科技分析师团队撰写。基于数数科技成立以来服务千余家游戏企业、近万个游戏项目的经验,作者介绍了游戏行业的数据分析现状,解读了数...
本书是介绍如何用Python 进行数据处理和分析的学习实战指南。主要内容包括Python语言基础、数据处理、数据分析、数据可视化图形的制作,以及利用Python...
在人工智能时代,不论是否从事大数据开发,掌握大数据的原理和架构早已成为每个工程师的必备技能。本书结合作者多年大数据开发、应用的经验,深入浅出地阐述大数据的完整知...
近年来,以Apache Spark为代表的大数据处理框架在学术界和工业界得到了广泛的使用。本书以Apache Spark框架为核心,总结了大数据处理框架的基础知...
目前,在基于大数据技术的数据中台建设过程中,由于缺乏完备的架构参考和类似于“脚手架”的原型项目,很多IT团队会在工程技术层面上感到无从下手。开发人员迫切地需要设...
本书在第1版的基础上,介绍大数据的时代背景及应用方案、常用的离线大数据和流式大数据组件,以及基于云平台的容器级数据平台搭建。书中以离线大数据和流式大数据两个具体...
本书是介绍大数据智能、人工智能技术的科普书籍,旨在让更多人了解和学习互联网时代的人工智能技术——自然语言处理技术,让大数据智能技术更好地为我们服务。<br>全书...
讲解了网络大数据时代应运而生的、能高效迅捷地分析处理数据的工具——Spark,它带领读者快速掌握用 Spark 收集、计算、简化和保存海量数据的方法,学会交互、...
Alluxio 这一以内存为中心的分布式虚拟文件系统,最初诞生于加州大学伯克利分校的 AMPLab,其开源社区在目前大数据生态系统中发展很快。本书以广泛使用的 ...
本书跟从大数据和人工智能应用的融合之路,通过分析和解读整个数据驱动智能核心技术,希望能给读者提供一个大数据智能核心技术体系的入门学习和应用参考指南。本书前半部分...
本书介绍了当下最流行的实时数据处理引擎Flink,讲解了流处理API、批处理API、机器学习引擎FlinkML、关系型API、复杂事件处理FLinkCEP,以及...
本书通过8章的内容,尽可能全面、详尽地介绍数据产品经理的能力、数据分析思维与实践、数据仓库理论与应用、大数据分析平台、大数据用户行为分析平台实践、数据产品规划与...
互联网的迅猛发展产生了海量的数据,海量的数据所蕴含的海量信息则提供了无限的可能。一大批大数据公司应运而生,它们中的一些犹如昙花一现,在快速崛起之后迅速陨落;也有...
阿里巴巴云上数据中台正服务着阿里生态中的数十个业务板块、百余家公司、千万级客户,在帮助决策层看清甚至决定业态走向的同时,在上万个业务场景中应用并催生创新。<br...
当前不乏大数据具体技术组件的书籍,但却很少有从大数据平台整体建设和产品形态的宏观角度入手来阐释的。本书重点介绍大数据开发平台服务构建的整体思路和解决方案,内容涵...
伴随着大数据时代的发展,数据价值的挖掘以及产品化逐渐被重视起来。本书作为该领域的入门教程,打破以往的数据工具与技术的介绍模式,凭借作者在大数据价值探索过程中的所...
在阿里巴巴集团内,数据人员面临的现实情况是:集团数据存储已经达到EB级别,部分单张表每天的数据记录数高达几千亿条;在2016年“双11购物狂欢节”的24小时中,...