目录 阅读 |
第1章 大数据的三把利剑 |
第2章 企业的大数据观 |
第3章 大数据和大数据系统 |
第4章 分布、键值对与族 |
第5章 HDFS(分布式文件系统) |
第6章 MapReduce 分布式编程模式 |
第7章 HBase 分布式数据库 |
第8章 系统设计背景和目标 |
第9章 系统架构设计 |
第10章 运行架构设计 |
第11章 安装规划 |
第12章 环境准备 |
第13章 集群安装 |
第14章 分布式应用安装 |
第15章 集成联调 |
第16章 大数据系统应用开发思路和环境 |
第17章 HDFS 文件读、写应用开发 |
第18章 HBase 数据库读、写应用开发 |
第19章 ZooKeeper 开发 |
第20章 MapReduce 开发 |
第21章 Pig 开发 |
第22章 Hive 开发 |
第23章 企业大数据盘系统 |
第24章 Hadoop 的日志分析 |
Shannon回答了有关UE4可视化问题的常见问题,解决了从数据导入和处理到照明、高级材料和渲染等问题。他揭示了UE4与传统渲染系统重要的不同之处,即使它们使用...
本书以大数据应用方面常用的语言Python为基础,从网络爬虫的实现原理入手,逐步引领读者进入网络爬虫的世界。在各类爬虫框架中,将Scrapy作为轴心,从多个维度...
Scala是一种表达能力非常强的语言,能够用非常简洁的代码表达丰富的业务含义。为了在生产上充分发挥Scala的能力,除了掌握其简洁的语法外,理解Scala在性能...
本书介绍了如何开发网络爬虫。内容主要包括开发网络爬虫所需要的Java语法基础和网络爬虫的工作原理,如何使用开源组件HttpClient和爬虫框架Crawler4...
Druid 作为一款开源的实时大数据分析软件,最近几年快速风靡全球互联网公司,特别是对于海量数据和实时性要求高的场景,包括广告数据分析、用户行为分析、数据统计分...