目录

目录

  • 目录
  • 第1部分 背景和基本原理
  • 第1章 跳跃中的Hadoop
  • 第2部分 数据逻辑.
  • 第2章 将数据导入导出Hadoop
  • 第3章 数据序列化——处理文本文件及其他格式的文件
  • 第3部分 大数据模式
  • 第4章 处理大数据的MapReduce 模式
  • 第5章 优化HDFS 处理大数据的技术
  • 第6章 诊断和优化性能问题
  • 第4部分 数据科学
  • 第7章 数据结构和算法的运用
  • 第8章 结合R 和Hadoop 进行数据统计
  • 第9章 使用Mahout 进行预测分析
  • 第5部分 驯服大象
  • 第10章 深入解析 Hive
  • 第11章 Pig 流管道
  • 第12章 Crunch 及相关技术
  • 第13章 测试和调试