图书介绍
并行计算导论pdf电子书版本下载
- 雷向东,雷振阳,龙军编著 著
- 出版社: 长沙:中南大学出版社
- ISBN:9787548733737
- 出版时间:2018
- 标注页数:288页
- 文件大小:39MB
- 文件页数:301页
- 主题词:并行算法;并行程序-程序设计
PDF下载
下载说明
并行计算导论PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如 BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 并行计算机体系结构 1
1.1 并行计算 1
1.2 计算机的四个发展阶段 2
1.3 高性能计算机的发展 3
1.4 计算机体系结构的弗林分类方法 4
1.5 SIMD体系结构 5
1.6 MIMD体系结构 6
1.6.1 共享存储器的组成 6
1.6.2 消息传递系统的组成 7
1.7 并行计算机类型 8
1.8 本章小结 9
第2章 多处理器互连网络 11
2.1 系统互连 11
2.2 互连网络的分类 13
2.2.1 按操作方式分类 13
2.2.2 按控制策略分类 13
2.2.3 按交换技术分类 13
2.2.4 按拓扑结构分类 13
2.3 动态互连网络 15
2.3.1 基于总线的动态互连网络 15
2.3.2 基于交换的互连网络 16
2.4 静态互连网络 18
2.4.1 全连接网络 18
2.4.2 有限连接网络 19
2.5 标准互联网络 23
2.6 并行计算机访存模型 26
2.6.1 UMA模型 26
2.6.2 NUMA模型 26
2.6.3 COMA模型 28
2.6.4 CC-NUMA模型 28
2.6.5 NORMA模型 29
2.6.6 并行机系统存储结构分类 30
2.7 并行机系统结构 30
2.8 本章小结 36
第3章 多处理器体系结构性能分析 38
3.1 并行计算机系统性能指标 38
3.2 Amdahl定律 40
3.3 Gustafson定律 42
3.4 Sun-Ni定律 42
3.5 并行体系结构的可扩展性 43
3.6 基准测试程序 44
3.7 本章小结 46
第4章 共享存储器系统 47
4.1 共享存储器分类 48
4.2 减少存储器访问冲突方法 49
4.2.1 造成热冲突的原因 50
4.2.2 减少热点冲突的策略 51
4.3 基于总线的对称多处理机系统 54
4.4 共享存储器系统高速缓存一致性 55
4.4.1 高速缓存-存储器一致性 55
4.4.2 高速缓存-高速缓存一致性 55
4.4.3 造成高速缓存与主存不一致的原因 56
4.4.4 高速缓存与高速缓存之间不一致的原因 56
4.4.5 共享存储器系统高速缓存一致性方法 58
4.5 基于监听总线协议 59
4.5.1 写-无效通写协议 59
4.5.2 写-无效和回写协议 61
4.5.3 写一次协议 63
4.5.4 写更新和部分通写协议 66
4.5.5 写-更新和回写协议 68
4.6 基于目录的协议 71
4.6.1 全映射目录 71
4.6.2 有限目录 73
4.6.3 链式目录 74
4.6.4 使无效协议 75
4.7 共享存储器的编程模型 78
4.8 本章小结 78
第5章 消息传递系统 82
5.1 消息传递系统结构 82
5.2 消息传递系统中的路由 83
5.2.1 广播和多播的路由 83
5.2.2 路由的潜在问题 84
5.3 消息传递中的交换机制 86
5.4 消息传递系统编程模型 87
5.5 本章小结 87
第6章 多核构架 88
6.1 多核技术 88
6.2 多核芯片 89
6.3 多核中的并行性 93
6.4 多核处理器关键技术 95
6.4.1 多级Cache设计与一致性问题 95
6.4.2 多核处理器核间通信技术 95
6.4.3 多核处理器总线设计 96
6.4.4 多核处理器操作系统设计 97
6.4.5 多核处理器低功耗设计 98
6.4.6 多核处理器存储器墙 99
6.5 本章小结 100
第7章 并行计算模型 101
7.1 并行计算模型 102
7.2 Brent定理 102
7.3 PRAM模型 103
7.4 APRAM模型 105
7.5 BSP模型 106
7.6 LogP模型 110
7.7 本章小结 111
第8章 并行算法 112
8.1 并行算法设计 112
8.2 数组求和 114
8.2.1 数组求总和 114
8.2.2 数组求所有部分和 115
8.3 排序 116
8.3.1 枚举排序 116
8.3.2 奇偶排序 117
8.3.3 希尔排序 119
8.3.4 快速排序 119
8.3.5 正则采样排序 121
8.4 矩阵运算 122
8.4.1 Cannon乘法 122
8.4.2 Fox乘法 124
8.5 线性方程组求解 126
8.5.1 高斯消元法 126
8.5.2 雅可比迭代法 128
8.5.3 高斯-塞德尔迭代法 131
8.5.4 超松弛迭代法 133
8.6 本章小结 136
第9章 并行程序设计方法 137
9.1 并行程序设计基本概念 137
9.2 并行度 138
9.3 交互/通信 140
9.3.1 通信 140
9.3.2 同步 141
9.3.3 聚集 142
9.3.4 交互方式 143
9.3.5 交互模式 144
9.4 并行编程风范 146
9.5 并行编程模型与并行语言 147
9.6 共享存储器编程 152
9.6.1 ANSI X3H5共享存储器模型 152
9.6.2 Posix线程模型 153
9.6.3 OpenMP标准 153
9.7 消息传递编程 154
9.7.1 PVP并行编程 154
9.7.2 MPI并行编程 155
9.8 数据并行编程 155
9.9 本章小结 156
第10章 MPI并行程序设计 158
10.1 MPI基本编程 158
10.2 点对点通信 161
10.2.1 阻塞通信 161
10.2.2 非阻塞通信 164
10.3 MPI预定义数据类型 165
10.4 通信模式 166
10.4.1 标准通信模式 167
10.4.2 缓存通信模式 167
10.4.3 同步通信模式 169
10.4.4 就绪通信模式 169
10.5 集合通信 170
10.5.1 组通信的消息通信功能 170
10.5.2 广播 171
10.5.3 收集 172
10.5.4 散发 174
10.5.5 组收集 174
10.5.6 全互换 175
10.5.7 同步 177
10.5.8 归约 177
10.5.9 组归约 181
10.5.10 扫描 182
10.5.11 用户自定义归约操作 183
10.6 对等模式和主从模式 183
10.7 非阻塞通信 185
10.7.1 非阻塞发送和接收 185
10.7.2 非阻塞通信的完成 188
10.7.3 非阻塞通信对象 191
10.7.4 消息到达的检查 192
10.8 重复非阻塞通信 193
10.9 进程组的管理 196
10.10 通信组的管理 200
10.11 虚拟进程拓扑 202
10.11.1 笛卡尔拓扑 203
10.11.2 图拓扑 206
10.12 本章小结 207
第11章 OpenMP并行程序设计 211
11.1 OpenMP编程基础 211
11.2 并行域 219
11.2.1 parallel结构 219
11.2.2 for指令 224
11.2.3 循环依赖 229
11.2.4 sections结构 232
11.2.5 simd结构 237
11.2.6 single结构 237
11.3 数据处理环境 238
11.3.1 private子句 239
11.3.2 firstprivate子句 240
11.3.3 lastprivate子句 241
11.3.4 threadprivate指令 243
11.3.5 shared子句 243
11.3.6 reduction子句 244
11.3.7 if子句 245
11.3.8 copyin子句 247
11.3.9 copyprivate子句 248
11.3.10 default子句 249
11.4 线程同步 250
11.4.1 critical指令 250
11.4.2 atomic指令 252
11.4.3 barrier指令 255
11.4.4 nowait子句 255
11.4.5 master指令 256
11.4.6 ordered指令 258
11.4.7 flush指令 259
11.4.8 互斥锁函数 260
11.5 任务调度 262
11.5.1 static调度 264
11.5.2 dynamic分配 266
11.5.3 guided调度 268
11.5.4 auto调度 270
11.5.5 runtime调度 270
11.6 本章小结 270
附录1 MPI函数调用 274
附录2 OpenMP指令和库函数 283
参考文献 288