目录 阅读 |
第1篇 Hadoop军营 |
第1章 Hadoop一石激起千层浪 |
第2章 MapReduce奠定基石 |
第3章 分布式文件系统 |
第4章 Hadoop体系的“四剑客” |
第5章 Hadoop资源管理与调度 |
第6章 Hadoop集群管理之道 |
第2篇 Spark星火燎原 |
第7章 Spark宝刀出鞘 |
第8章 Spark核心RDD |
第9章 Spark运行模式和流程 |
第10章 Shark和Spark SQL |
第11章 Spark Streaming流数据处理新贵 |
第12章 Spark Grahx图计算系统 |
第13章 Spark Cluster管理 |
第3篇 其他大数据处理系统 |
第14章 专为流数据而生的Storm |
第15章 Dremel和Drill |
第4篇 大数据下的日志分析系统 |
第16章 日志分析解决方案 |
第17章 ELK集群部署与应用 |
第5篇 数据分析技术前景展望 |
第18章 大数据处理的思考与展望 |
小编说:一提到大数据处理,相信很多人第一时间想到的是 Hadoop MapReduce。没错,Hadoop MapReduce 为大数据处理技术奠定了基础。近年来,随着 Spark 的发展,越来越多的声音提到了 Spark。而Spark...
很多企业热衷于谈论大数据,却忽视企业内部的基础数据管理以及内部管理团队的数据思维训练。不重视数据,就不会有数据;没有数据、没有具备数据思维的管理团队,大数据跟你...
本书是首部介绍语音识别中深度学习技术细节的专著。全书首先概要介绍了传统语音识别理论和经典的深度神经网络核心算法。接着全面而深入地介绍了深度学习在语音识别中的应用...
从金融与大数据的天然联系展开,阐述了金融行业实施大数据战略的必要性以及优势。冷静、客观的从数据角度分析了金融行业如何基于自身的特点来搭建大数据的环境,打通业务环...
本书试图全面介绍IBM SPSS在构建基于数据深度分析的行业解决方案方面的预测 分析功能,试图涵盖统计分析、数据挖掘和决策管理三个方面的内容。IBM SPSS...
可视化是数据分析处理的重要手段。国内迄今尚无一本原创的数据可视化教材。 本书的内容将以归纳介绍核心的数据可视化原理为主,每章添加一个小章节总结最新研究进展(作...
Shannon回答了有关UE4可视化问题的常见问题,解决了从数据导入和处理到照明、高级材料和渲染等问题。他揭示了UE4与传统渲染系统重要的不同之处,即使它们使用...
本书以大数据应用方面常用的语言Python为基础,从网络爬虫的实现原理入手,逐步引领读者进入网络爬虫的世界。在各类爬虫框架中,将Scrapy作为轴心,从多个维度...
Scala是一种表达能力非常强的语言,能够用非常简洁的代码表达丰富的业务含义。为了在生产上充分发挥Scala的能力,除了掌握其简洁的语法外,理解Scala在性能...
本书介绍了如何开发网络爬虫。内容主要包括开发网络爬虫所需要的Java语法基础和网络爬虫的工作原理,如何使用开源组件HttpClient和爬虫框架Crawler4...
Druid 作为一款开源的实时大数据分析软件,最近几年快速风靡全球互联网公司,特别是对于海量数据和实时性要求高的场景,包括广告数据分析、用户行为分析、数据统计分...