图书介绍

Hadoop大数据解决方案【2025|PDF下载-Epub版本|mobi电子书|kindle百度云盘下载】

Hadoop大数据解决方案
  • (美)BenoyAntony等著;殷聪贤,杨朋朋译 著
  • 出版社: 北京:清华大学出版社
  • ISBN:9787302466451
  • 出版时间:2017
  • 标注页数:264页
  • 文件大小:63MB
  • 文件页数:284页
  • 主题词:数据处理软件

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

Hadoop大数据解决方案PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 Hadoop概述1

1.1 商业分析与大数据2

1.1.1 Hadoop的组件3

1.1.2 Hadoop分布式文件系统(HDFS)3

1.1.3 MapReduce是什么4

1.1.4 YARN是什么5

1.2 ZooKeeper是什么6

1.3 Hive是什么7

1.4 与其他系统集成8

1.4.1 Hadoop生态系统9

1.4.2 数据集成与Hadoop11

1.5 小结16

第2章 存储19

2.1 Hadoop HDFS的基础知识20

2.1.1 概念21

2.1.2 架构25

2.1.3 接口29

2.2 在分布式模式下设置HDFS群集35

2.3 HDFS的高级特性40

2.3.1 快照41

2.3.2 离线查看器44

2.3.3 分层存储52

2.3.4 纠删码55

2.4 文件格式59

2.5 云存储63

2.6 小结64

第3章 计算65

3.1 Hadoop MapReduce的基础66

3.1.1 概念66

3.1.2 架构69

3.2 如何启动MapReduce作业76

3.2.1 编写Map任务77

3.2.2 编写reduce任务79

3.2.3 编写MapReduce作业80

3.2.4 配置83

3.3 MapReduce的高级特性85

3.3.1 分布式缓存85

3.3.2 计数器87

3.3.3 作业历史服务器89

3.4 与Spark作业的区别91

3.5 小结92

第4章 用户体验93

4.1 Apache Hive94

4.1.1 安装Hive96

4.1.2 HiveQL97

4.1.3 UDF/SerDe103

4.1.4 Hive调优105

4.2 Apache Pig106

4.2.1 安装Pig107

4.2.2 Pig Latin108

4.3 UDF110

4.4 Hue111

4.5 Apache Oozie114

4.5.1 安装Oozie115

4.5.2 Oozie的工作原理118

4.5.3 工作流/协调器119

4.5.4 Oozie CLI124

4.6 小结124

第5章 与其他系统集成125

5.1 Apache Sqoop126

5.2 Apache Flume130

5.3 Apache Kafka136

5.3.1 工作原理138

5.3.2 Kafka Connect141

5.3.3 流处理143

5.4 Apache Storm144

5.4.1 工作原理145

5.4.2 Trident148

5.4.3 Kafka集成149

5.5 小结152

第6章 Hadoop安全153

6.1 提升Hadoop群集安全性154

6.1.1 边界安全154

6.1.2 Kerberos认证156

6.1.3 Hadoop中的服务级授权162

6.1.4 用户模拟167

6.1.5 提升HTTP信道的安全性170

6.2 提升数据安全性174

6.2.1 数据分类175

6.2.2 将数据传到群集176

6.2.3 保护群集中的数据182

6.3 增强应用程序安全性189

6.3.1 YARN架构189

6.3.2 YARN中的应用提交190

6.4 小结195

第7章 自由的生态圈:Hadoop与Apache BigTop197

7.1 基础概念198

7.1.1 软件栈199

7.1.2 测试栈200

7.1.3 在我的笔记本电脑上工作201

7.2 开发定制的软件栈201

7.2.1 Apache Bigtop:历史201

7.2.2 Apache Bigtop:概念和哲学思想202

7.2.3 项目结构204

7.2.4 谈谈构建系统205

7.2.5 工具链和开发环境206

7.2.6 BOM定义207

7.3 部署208

7.3.1 Bigtop Provisioner208

7.3.2 群集的无主节点Puppet部署209

7.3.3 使用Puppet进行配置管理213

7.4 集成验证215

7.4.1 iTests和验证应用程序216

7.4.2 栈集成测试开发217

7.4.3 栈的验证220

7.4.4 群集故障测试221

7.4.5 栈的冒烟测试222

7.5 将所有工作组合在一起223

7.6 小结224

第8章 Hadoop软件栈的In-Memory计算227

8.1 In-Memory计算简介229

8.2 Apache Ignite:内存优先231

8.2.1 Apache Ignite的系统体系架构232

8.2.2 数据网格233

8.2.3 高可用性讨论236

8.2.4 计算网格237

8.2.5 服务网格238

8.2.6 内存管理238

8.2.7 持久化存储240

8.3 使用Ignite加速旧式Hadoop240

8.3.1 In-Memory存储的好处241

8.3.2 内存文件系统:HDFS缓存242

8.3.3 In-Memory MapReduce243

8.4 Apache Ignite的高级用法247

8.4.1 Spark和Ignite247

8.4.2 共享状态249

8.4.3 Hadoop上的In-Memory SQL251

8.4.4 使用Ignite的SQL252

8.4.5 使用Apache Ignite进行流处理255

8.5 小结256

术语表259

热门推荐