图书介绍
信息与计算机科学丛书 68 并行计算与实现技术【2025|PDF下载-Epub版本|mobi电子书|kindle百度云盘下载】

- 迟学斌,王彦棢,王珏等编著 著
- 出版社: 北京:科学出版社
- ISBN:9787030445506
- 出版时间:2015
- 标注页数:192页
- 文件大小:29MB
- 文件页数:204页
- 主题词:并行算法
PDF下载
下载说明
信息与计算机科学丛书 68 并行计算与实现技术PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 并行计算基础1
1.1什么是并行计算1
1.2为什么需要并行计算2
1.3并行计算机的发展4
1.4并行算法复杂性分析5
1.5并行计算的基本概念7
第2章 基础并行算法9
2.1并行算法设计基本原则9
2.2区域分解方法10
2.3功能分解方法11
2.4流水线技术12
2.5分而治之方法13
2.6同步并行算法14
2.7异步并行算法14
第3章 经典算法的并行计算16
3.1矩阵乘并行计算方法16
3.1.1矩阵卷帘存储方式16
3.1.2并行矩阵乘法17
3.2线性方程组并行求解方法21
3.2.1分布式系统的并行LU分解算法22
3.2.2三角方程组的并行解法23
3.3经典迭代算法的并行化25
3.3.1 Jacobi迭代法25
3.3.2 Gauss-Seidel迭代法26
3.4特征值问题并行计算方法27
3.4.1对称三对角矩阵特征值问题27
3.4.2 Householder变换28
3.4.3化对称矩阵为三对角矩阵29
第4章 消息传递编程接口MPI30
4.1并行环境函数30
4.2 MPI进程控制函数32
4.2.1 MPI进程组操作函数32
4.2.2 MPI通信子操作36
4.3点到点通信函数39
4.3.1阻塞式通信函数39
4.3.2非阻塞式通信函数44
4.3.3特殊的点到点通信函数49
4.3.4 MPI的通信模式50
4.4自定义数据类型51
4.4.1用户定义的数据类型51
4.4.2 MPI的数据打包与拆包59
4.5聚合通信函数62
4.5.1障碍同步62
4.5.2单点与多点通信函数62
4.5.3多点与多点通信函数66
4.6全局归约操作函数70
第5章 共享存储并行编程OpenMP80
5.1 OpenMP发展历程80
5.2 OpenMP执行模型和存储模型81
5.3 OpenMP指导语句82
5.3.1 parallel结构83
5.3.2工作共享结构85
5.3.3数据共享属性子句98
5.3.4其他子句104
5.3.5 Tasking结构107
5.3.6结构嵌套规则111
5.4 OpenMP运行时函数库111
5.4.1运行时函数定义111
5.4.2执行环境函数111
5.4.3锁函数116
5.4.4时间函数120
5.5 OpenMP环境变量120
5.6 OpenMP在MIC架构上的优化技术122
5.6.1 offload模式下将Host环境传播至MIC(target)计算节点122
5.6.2 offload模式提供了多种关键字来实现多功能的需求122
5.6.3查看编译器对程序中OpenMP区域的优化处理123
5.6.4 OpenMP在Offload及Native模式下的不同缺省值123
5.6.5设置OpenMP的栈空间大小124
5.6.6分配部分计算资源给运行的程序125
第6章 GPU并行加速实现技术126
6.1 GPU以及GPGPU发展简介126
6.2 CUDA并行编程模型129
6.2.1线程结构129
6.2.2线程调度132
6.3 CUDA软件体系134
6.3.1 CUDA函数定义以及变量类型限定符134
6.3.2 CUDA算数指令与数学函数136
6.3.3 CUDA内置函数136
6.3.4 CUDA软件体系结构137
6.3.5 CUDA程序的编译139
6.4 CUDA存储器模型139
6.4.1寄存器141
6.4.2全局存储器141
6.4.3本地存储器145
6.4.4共享存储器145
6.4.5常量存储器147
6.4.6纹理存储器147
6.5 CUDA程序的优化151
6.5.1处理器利用率优化152
6.5.2指令吞吐量优化154
6.5.3存储器访问优化157
6.5.4矩阵乘法程序优化示例163
6.5.5矩阵转置程序优化示例165
6.6 MPI/CUDA混合编程170
6.6.1 MPI/CUDA混合编程模型171
6.6.2 GPU集群上的数据传输模型172
6.6.3 MPI/CUDA混合编程以及编译运行示例174
6.6.4 MPI/OpenMP/CUDA混合编程177
6.6.5异构平台数学库MAGMA简介184
参考文献186
索引189
《信息与计算科学丛书》已出版书目191
热门推荐
- 3479861.html
- 3800793.html
- 2408646.html
- 2548546.html
- 3714157.html
- 447423.html
- 884432.html
- 2131702.html
- 3133955.html
- 87098.html
- http://www.ickdjs.cc/book_3327728.html
- http://www.ickdjs.cc/book_2626812.html
- http://www.ickdjs.cc/book_1865922.html
- http://www.ickdjs.cc/book_2351537.html
- http://www.ickdjs.cc/book_226026.html
- http://www.ickdjs.cc/book_474534.html
- http://www.ickdjs.cc/book_1240649.html
- http://www.ickdjs.cc/book_784444.html
- http://www.ickdjs.cc/book_2663829.html
- http://www.ickdjs.cc/book_3660103.html