图书介绍

Hadoop开源云计算平台pdf电子书版本下载

刘刚，侯宾，翟周伟编著著
出版社：北京：北京邮电大学出版社
ISBN：7563526901
出版时间：2011
标注页数：217页
文件大小：37MB
文件页数：229页
主题词：

PDF下载

点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快] 温馨提示：（请使用BT下载软件FDM进行下载）软件下载地址页直链下载[便捷但速度慢] [在线试读本书] [在线获取解压码]

点击复制MD5值：f7c603ad3e00ba5d9b47c09f4de34d7f

下载说明

Hadoop开源云计算平台PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

点击复制85GB完整离线版磁力链接到迅雷FDM等BT下载工具进行下载详情点击-查看共享计划

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台）。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如 BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用！后期资源热门了。安装了迅雷也可以迅雷进行下载！

（文件页数要大于标注页数，上中下等多册电子书除外）

注意：本站所有压缩包均有解压码： 点击下载压缩包解压工具

图书目录

第1章云计算背景与Hadoop 1

1.1 云计算起源与发展历程 1

1.2 云计算定义与体系 2

1.3 云计算关键技术 4

1.3.1 虚拟化技术 4

1.3.2 分布式计算和并行计算 4

1.3.3 分布式存储 5

1.3.4 分布式海量数据管理 5

1.4 Hadoop与云计算 6

1.5 谁在使用Hadoop 6

1.5.1 外国Hadoop应用 6

1.5.2 国内Hadoop应用 8

第2章 Hadoop概述 10

2.1 Hadoop起源及简介 10

2.2 Hadoop发展历程与现状 11

2.3 Hadoop的总体结构与模块简介 11

2.4 小结 15

第3章 Hadoop伪分布式文件系统 16

3.1 引言 16

3.2 HDFS构架设计 17

3.2.1 前提和设计目标 17

3.2.2 NameNode和DataNode 18

3.2.3 文件系统的命名空间 18

3.2.4 数据复制 19

3.2.5 副本存放 19

3.2.6 副本选择 20

3.2.7 安全模式 20

3.2.8 文件系统元数据的持久化 20

3.2.9 通信协议 21

3.2.10 健壮性 21

3.2.11 数据组织 22

3.2.12 可访问性 23

3.2.13 空间的回收 24

3.3 Hadoop分布式文件系统的使用 24

3.3.1 Web接口 25

3.3.2 shell命令 25

3.3.3 dfsadmin命令 25

3.3.4 Secondary NameNode 26

3.3.5 Rebalancer 27

3.3.6 机架感知 27

3.3.7 安全模式 27

3.3.8 fsck 28

3.3.9 升级和回滚 28

3.3.10 文件权限和安全性 28

3.3.11 可扩展性 28

3.4 HDFS权限管理 29

3.4.1 用户身份 29

3.4.2 理解系统的实现 29

3.4.3 超级用户 30

3.4.4 Web服务器 30

3.4.5 在线升级 30

3.4.6 配置参数 30

3.5 HDFS配额管理 31

3.6 Hadoop文件归档 31

3.7 HDFS的缺点 32

3.8 小结 33

第4章 Hadoop FS shell 34

4.1 引言 34

4.2 FS shell 34

4.3 小结 40

第5章 Hadoop Map/Reduce 41

5.1 Map/Reduce简介 41

5.2 Map/Reduce编程思想 42

5.3 Map/Reduce引例 43

5.4 Map/Reduce核心功能 50

5.4.1 Mapper 50

5.4.2 Reducer 51

5.4.3 Partitioner 52

5.4.4 Reporter 52

5.4.5 OutputCollector 53

5.4.6 作业配置 53

5.4.7 任务的执行和环境 53

5.4.8 作业的提交与监控 55

5.4.9 作业的输入 56

5.4.10 作业的输出 58

5.4.11 其他有用的特性 60

5.5 小结 63

第6章 Hadoop流与管道机制 65

6.1 概述 65

6.2 Hadoop流 65

6.2.1 Hadoop流工作机制 65

6.2.2 Hadoop流相关选项 67

6.2.3 流应用举例 70

6.3 Hadoop管道机制 71

6.4 小结 73

第7章 Hadoop输入和输出 74

7.1 Map/Reduce输入与输出 74

7.2 HDFS的输入和输出 75

7.2.1 从HDFS读取文件 75

7.2.2 给HDFS写入文件 76

7.3 小结 77

第8章 Hadoop常用命令 78

8.1 Hadoop命令概述 78

8.2 用户命令 79

8.2.1 archive 79

8.2.2 distcp 80

8.2.3 fs 83

8.2.4 fsck 83

8.2.5 jar 84

8.2.6 job 84

8.2.7 pipes 85

8.2.8 version 85

8.2.9 CLASSNAME 85

8.3 Hadoop管理员命令 85

8.3.1 balancer 86

8.3.2 daemonlog 86

8.3.3 datanode 86

8.3.4 dfsadmin 87

8.3.5 jobtracker 88

8.3.6 namenode 88

8.3.7 secondarynamenode 88

8.3.8 tasktracker 89

8.4 小结 89

第9章 Hadoop部署与开发 90

9.1 概述 90

9.2 Hadoop运行环境 90

9.2.1 Hadoop硬件配置 90

9.2.2 Hadoop集群大小 91

9.2.3 虚拟化基础承载Hadoop 91

9.2.4 软件需求和系统需求 92

9.3 Hadoop单机部署 92

9.3.1 安装所需软件 92

9.3.2 本地模式 93

9.3.3 Hadoop伪分布式模式 93

9.4 Hadoop的完全分布式部署 95

9.4.1 相关配置 96

9.4.2 Hadoop启动与停止 101

9.5 Hadoop部署示例 102

9.5.1 配置文件 102

9.5.2 启动Hadoop与简单测试 105

9.6 Hadoop应用程序开发 106

9.6.1 安装Hadoop并启动 107

9.6.2 安装eclipse环境 107

9.6.3 开发实例 109

9.7 小结 117

第10章 Zookeeper 118

10.1 概述 118

10.2 Zookeeper的安装 119

10.2.1 软件及环境要求 119

10.2.2 独立模式 119

10.2.3 复制模式 120

10.3 Zookeeper的设计目标 121

10.4 数据模型和层次名称空间 122

10.5 保证 123

10.6 简单的API接口 123

10.7 Zookeeper实现机制 123

10.8 性能 124

10.8.1 读写性能测试 125

10.8.2 可靠性测试 125

10.9 小结 126

第11章 HBase 127

11.1 HBase简介 127

11.2 HBase中的数据模型 127

11.3 HBase的体系结构 129

11.4 安装部署HBase 131

11.4.1 单机安装 131

11.4.2 分布式安装部署 132

11.5 HBase用户接口 135

11.5.1 shell命令行接口 135

11.5.2 HBase常用Java接口 137

11.6 HBase与RDBMS的简单比较 138

11.7 小结 140

第12章 Pig 141

12.1 Pig简介 141

12.2 Pig安装和运行 142

12.2.1 Pig的安装 142

12.2.2 Pig的运行模式 143

12.2.3 运行Pig 143

12.3 Pig Latin脚本语言 146

12.3.1 数据类型 146

12.3.2 Pig Latin语句 148

12.3.3 Pig Latin编程示例 149

12.4 利用Pig并行处理海量数据 153

12.4.1 Pig内置函数 153

12.4.2 用户自定义函数UDF 154

12.5 小结 155

第13章 Hive 156

13.1 Hive简介 156

13.2 Hive的安装和运行测试 157

13.3 HQL语言 161

13.3.1 数据类型和对象 161

13.3.2 HQL查询语言 162

13.4 Hive应用开发 169

13.4.1 JDBC 170

13.4.2 利用分隔符导入文件 170

13.4.3 Deserializer的使用 171

第14章 CloudBase 173

14.1 数据仓库与CloudBase简介 173

14.2 CloudBase系统工作机制简介 174

14.3 CloudBase安装部署 175

14.3.1 部署构架 175

14.3.2 安装CloudBase 175

14.3.3 安装CloudBase客户端 176

14.4 CloudBase中的ANSI SQL 177

14.4.1 数据类型和对象 177

14.4.2 ANSI SQL语言简介 178

14.4.3 CloudBase相关表操作 178

14.5 基于CloudBase的应用开发 185

14.5.1 使用JDBC 185

14.5.2 利用分隔符导入文件 185

14.5.3 UDT的使用 186

14.5.4 DataBase Link的使用 187

14.6 CloudBase、Hive和HBase的比较 187

14.7 小结 188

第15章 Mahout 189

15.1 Mahout简介 189

15.2 Mahout的安装和运行 189

15.3 相关算法简介 191

15.3.1 分类算法简介 191

15.3.2 聚类算法简介 193

15.3.3 模式挖掘 196

15.3.4 协同过滤 196

15.4 并行分类算法分析与实例 197

15.4.1 并行分类算法分析 197

15.4.2 分类示例 203

15.5 并行聚类算法与实例 208

15.5.1 并行聚类算法分析 208

15.5.2 聚类示例 211

15.6 基于Mahout的应用 213

15.6.1 应用构架 213

15.6.2 应用实例 214

参考文献 217