图书介绍

高性能计算系统与大数据分析pdf电子书版本下载

高性能计算系统与大数据分析
  • (印)佩瑟鲁·拉吉等著;齐宁译 著
  • 出版社: 北京:机械工业出版社
  • ISBN:9787111611752
  • 出版时间:2018
  • 标注页数:274页
  • 文件大小:44MB
  • 文件页数:290页
  • 主题词:高性能计算机-计算机系统;数据处理

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
下载压缩包 [复制下载地址] 温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页

下载说明

高性能计算系统与大数据分析PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如 BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 IT领域的变革以及未来趋势 1

1.1 引言 1

1.2 新兴的IT趋势 1

1.3 数字化实体的实现与发展 4

1.4 物联网/万物互联 5

1.5 对社交媒体网站的广泛采用 7

1.6 预测性、规范性、个性化分析时代 7

1.7 用于大数据及分析的Apache Hadoop 11

1.8 大数据、大洞见、大动作 13

1.9 结论 15

1.10 习题 15

第2章 大数据/快速数据分析中的高性能技术 16

2.1 引言 16

2.2 大数据分析学科的出现 17

2.3 大数据的战略意义 18

2.4 大数据分析的挑战 19

2.5 高性能计算范型 19

2.6 通过并行实现高性能的方法 21

2.7 集群计算 22

2.8 网格计算 24

2.9 云计算 27

2.10 异构计算 29

2.11 用于高性能计算的大型机 31

2.12 用于大数据分析的超级计算 32

2.13 用于大数据分析的设备 32

2.13.1 用于大规模数据分析的数据仓库设备 33

2.13.2 in-memory大数据分析 35

2.13.3 大数据的in-database处理 37

2.13.4 基于Hadoop的大数据设备 38

2.13.5 高性能大数据存储设备 41

2.14 结论 42

2.15 习题 42

参考文献 43

第3章 大数据与快速数据分析对高性能计算的渴望 44

3.1 引言 44

3.2 重新审视大数据分析范型 45

3.3 大数据和快速数据的含义 47

3.4 用于精确、预测性、规范性洞见的新兴数据源 48

3.5 大数据分析为何不俗 50

3.6 传统的和新一代的数据分析案例研究 51

3.7 为何采用基于云的大数据分析 55

3.8 大数据分析:主要处理步骤 57

3.9 实时分析 58

3.10 流分析 62

3.11 传感器分析 63

3.11.1 大数据分析与高性能计算的同步:附加价值 63

3.12 结论 64

3.13 习题 64

第4章 高性能大数据分析的网络基础设施 65

4.1 引言 65

4.2 当前网络基础设施的局限 66

4.3 高性能大数据分析网络基础设施的设计方法 68

4.3.1 网络虚拟化 68

4.3.2 软件定义网络 76

4.3.3 网络功能虚拟化 78

4.4 用于传输大数据的广域网优化 79

4.5 结论 81

4.6 习题 81

参考文献 81

第5章 高性能大数据分析的存储基础设施 82

5.1 引言 82

5.2 直连式存储 83

5.2.1 DAS的缺点 84

5.3 存储区域网络 85

5.3.1 块级访问 85

5.3.2 文件级访问 85

5.3.3 对象级访问 85

5.4 保存大数据的存储基础设施需求 86

5.5 光纤通道存储区域网络 87

5.6 互联网协议存储区域网络 88

5.6.1 以太网光纤通道 88

5.7 网络附属存储 89

5.8 用于高性能大数据分析的流行文件系统 89

5.8.1 Google文件系统 89

5.8.2 Hadoop分布式文件系统 91

5.8.3 Panasas 92

5.8.4 Luster 文件系统 94

5.9 云存储简介 96

5.9.1 云存储系统的架构模型 96

5.9.2 存储虚拟化 98

5.9.3 云存储中使用的存储优化技术 100

5.9.4 云存储的优点 101

5.10 结论 101

5.11 习题 101

参考文献 102

进一步阅读 102

第6章 使用高性能计算进行实时分析 103

6.1 引言 103

6.2 支持实时分析的技术 103

6.2.1 in-memory处理 103

6.2.2 in-database分析 105

6.3 大规模在线分析 106

6.4 通用并行文件系统 107

6.4.1 GPFS用例 107

6.5 GPFS客户案例研究 111

6.5.1 广播公司:VRT 111

6.5.2 石油公司从Lustre迁移到GPFS 113

6.6 GPFS:关键的区别 113

6.6.1 基于GPFS的解决方案 114

6.7 机器数据分析 114

6.7.1 Splunk 114

6.8 运营分析 115

6.8.1 运营分析中的技术 115

6.8.2 用例以及运营分析产品 116

6.8.3 其他IBM运营分析产品 117

6.9 结论 117

6.10 习题 118

第7章 高性能计算范型 119

7.1 引言 119

7.2 为何还需要大型机 119

7.3 大型机中HPC是如何演化的 120

7.3.1 成本:HPC的一个重要因素 120

7.3.2 云计算中的集中式HPC 120

7.3.3 集中式HPC的要求 121

7.4 HPC远程模拟 121

7.5 使用HPC的大型机解决方案 121

7.5.1 智能大型机网格 121

7.5.2 IMG的工作原理 122

7.5.3 IMG架构 122

7.6 架构模型 125

7.6.1 具有共享磁盘的存储服务器 125

7.6.2 没有共享磁盘的存储服务器 125

7.6.3 无存储服务器的通信网络 125

7.7 对称多处理 126

7.7.1 什么是SMP 126

7.7.2 SMP与集群方法 126

7.7.3 SMP是否真的重要 126

7.7.4 线程模型 127

7.7.5 NumaConnect技术 127

7.8 用于HPC的虚拟化 127

7.9 大型机方面的创新 127

7.10 FICON大型机接口 128

7.11 大型机对手机的支持 129

7.12 Windows高性能计算 129

7.13 结论 130

7.14 习题 131

第8章 in-database处理与in-memory分析 132

8.1 引言 132

8.1.1 分析工作负载与事务工作负载的对比 132

8.1.2 分析工作负载的演化 133

8.1.3 传统分析平台 135

8.2 in-database分析 135

8.2.1 架构 137

8.2.2 优点和局限 138

8.2.3 代表性的系统 138

8.3 in-memory分析 140

8.3.1 架构 141

8.3.2 优点和局限 142

8.3.3 代表性的系统 142

8.4 分析设备 145

8.4.1 Oracle Exalytics 145

8.4.2 IBM Netezza 145

8.5 结论 147

8.6 习题 147

参考文献 148

进一步阅读 148

第9章 大数据/快速数据分析中的高性能集成系统、数据库和数据仓库 149

9.1 引言 149

9.2 下一代IT基础设施和平台的关键特征 150

9.3 用于大数据/快速数据分析的集成系统 150

9.3.1 用于大数据分析的Urika-GD设备 151

9.3.2 IBM PureData System forAnalytics 152

9.3.3 Oracle Exadata Database Machine 153

9.3.4 Teradata数据仓库和大数据设备 153

9.4 大数据分析的融合式基础设施 154

9.5 高性能分析:大型机+Hadoop 155

9.6 快速数据分析的in-memory平台 158

9.7 大数据分析的in-database平台 160

9.8 用于高性能大数据/快速数据分析的云基础设施 161

9.9 用于大数据的大文件系统 164

9.10 用于大数据/快速数据分析的数据库和数据仓库 166

9.10.1 用于大数据分析的NoSQL数据库 167

9.10.2 用于大数据/快速数据分析的NewSQL数据库 169

9.10.3 用于大数据分析的高性能数据仓库 170

9.11 流分析 173

9.12 结论 176

9.13 习题 176

第10章 高性能网格和集群 177

10.1 引言 177

10.2 集群计算 179

10.2.1 集群计算的动机 179

10.2.2 集群计算架构 180

10.2.3 软件库和编程模型 182

10.2.4 先进集群计算系统 189

10.2.5 网格与集群间的差异 189

10.3 网格计算 190

10.3.1 网格计算的动机 191

10.3.2 网格计算的演进 192

10.3.3 网格系统的设计原则和目标 192

10.3.4 网格系统架构 193

10.3.5 网格计算系统的优点和局限 196

10.3.6 网格系统和应用 196

10.3.7 网格计算的未来 201

10.4 结论 202

10.5 习题 202

参考文献 203

进一步阅读 204

第11章 高性能P2P系统 205

11.1 引言 205

11.2 设计原则与特点 206

11.3 P2P系统架构 207

11.3.1 集中式P2P系统 207

11.3.2 分散式P2P系统 208

11.3.3 混合P2P系统 210

11.3.4 高级P2P架构通信协议和框架 211

11.4 高性能P2P应用 212

11.4.1 Cassandra 212

11.4.2 SETI@Home 214

11.4.3 比特币:基于P2P的数字货币 215

11.5 结论 216

11.6 习题 217

参考文献 217

进一步阅读 219

第12章 高性能大数据分析的可视化维度 220

12.1 引言 220

12.2 常用技术 224

12.2.1 图表 224

12.2.2 散点图 225

12.2.3 树状图 226

12.2.4 箱形图 226

12.2.5 信息图 227

12.2.6 热图 227

12.2.7 网络和图的可视化 228

12.2.8 词云与标签云 228

12.3 数据可视化工具与系统 229

12.3.1 Tableau 229

12.3.2 Birst 231

12.3.3 Roambi 232

12.3.4 Qlikview 233

12.3.5 IBM Cognos 234

12.3.6 Google Charts和融合表 234

12.3.7 Data-Driven Documents(D3.js) 235

12.3.8 Sisense 236

12.4 结论 237

12.5 习题 237

参考文献 238

进一步阅读 238

第13章 用于组织增权的社交媒体分析 239

13.1 引言 239

13.1.1 社交数据收集 239

13.1.2 社交数据分析 240

13.1.3 移动设备的发展 240

13.1.4 强大的可视化机制 240

13.1.5 数据本身的快速变化 240

13.2 社交媒体分析入门 241

13.3 建立一个用于企业社交媒体分析的框架 242

13.4 社交媒体内容指标 243

13.5 社交媒体分析的预测分析技术 244

13.6 使用文本挖掘的情感分析架构 245

13.7 社交媒体数据的网络分析 246

13.7.1 社交媒体数据的网络分析入门 246

13.7.2 使用Twitter的网络分析 247

13.7.3 极化网络图 247

13.7.4 In-Group图 248

13.7.5 Twitter品牌图 248

13.7.6 Bazaar网络 248

13.7.7 广播图 248

13.7.8 支持网络图 248

13.8 组织的社交媒体分析的不同方面 249

13.8.1 收入及销售的潜在客户开发 250

13.8.2 客户关系和客户体验管理 251

13.8.3 创新 251

13.9 社交媒体工具 251

13.9.1 社交媒体监控工具 251

13.9.2 社交媒体分析工具 252

13.10 结论 252

13.11 习题 252

参考文献 252

第14章 医疗保健的大数据分析 253

14.1 引言 253

14.2 影响医疗保健的市场因素 254

14.3 不同的相关方设想不同的目标 255

14.4 大数据对医疗保健的好处 255

14.4.1 医疗保健效率和质量 256

14.4.2 早期疾病检测 256

14.4.3 欺诈检测 256

14.4.4 人口健康管理 257

14.5 大数据技术采纳:一个新的改进 258

14.5.1 IBM Watson 258

14.5.2 IBM Watson架构 258

14.6 医疗保健领域中的Watson 259

14.6.1 WellPoint和IBM 259

14.7 EHR技术 259

14.7.1 EHR数据流 260

14.7.2 EHR的优点 261

14.8 远程监控和传感 261

14.8.1 技术组件 261

14.8.2 应用远程监控的医疗保健领域 261

14.8.3 远程监控的局限 262

14.9 面向医疗保健的高性能计算 262

14.10 人脑网络的实时分析 262

14.11 癌症检测 263

14.12 3D医学图像分割 263

14.13 新兴医疗方法 264

14.14 BDA在医疗保健方面的用例 264

14.15 人口健康控制 265

14.16 护理流程管理 265

14.16.1 核心IT功能 265

14.17 Hadoop用例 266

14.18 大数据分析:成功案例 268

14.19 BDA在医疗保健方面的机会 269

14.20 Member 360 269

14.21基因组学 269

14.22临床监测 271

14.23 BDA在医疗保健中的经济价值 271

14.24医疗保健的大数据挑战 272

14.25医疗保健大数据的未来 273

14.26结论 273

14.27习题 273

精品推荐