大规模并行处理器程序设计(英文版 原书第3版) caj kindle 百度云 azw3 夸克云 下载 pdb pdf

大规模并行处理器程序设计(英文版 原书第3版)电子书下载地址
- 文件名
- [epub 下载] 大规模并行处理器程序设计(英文版 原书第3版) epub格式电子书
- [azw3 下载] 大规模并行处理器程序设计(英文版 原书第3版) azw3格式电子书
- [pdf 下载] 大规模并行处理器程序设计(英文版 原书第3版) pdf格式电子书
- [txt 下载] 大规模并行处理器程序设计(英文版 原书第3版) txt格式电子书
- [mobi 下载] 大规模并行处理器程序设计(英文版 原书第3版) mobi格式电子书
- [word 下载] 大规模并行处理器程序设计(英文版 原书第3版) word格式电子书
- [kindle 下载] 大规模并行处理器程序设计(英文版 原书第3版) kindle格式电子书
寄语:
并行编程领域之作,被图灵奖得主David Patterson誉为“天赐之书”,并被UIUC、MIT等名校用作教材
内容简介:
本书介绍并行编程和GPU架构的基本概念,详细探索了构建并行程序的各种技术,涵盖性能、浮点格式、并行模式和动态并行等主题,适合专业人士及学生阅读。书中通过案例研究展示了开发过程,从计算思维的细节着手,*终给出了高效的并行程序示例。新版更新了关于CUDA的讨论,包含CuDNN等新的库,同时将不再重要的内容移到附录中。新版还增加了关于并行模式的两个新章节,并更新了案例研究,以反映当前的行业实践。
书籍目录:
Preface Acknowledgements
CHAPTER.1 Introduction.1
1.1 Heterogeneous Parallel Computing..2
1.2 Architecture of a Modern GPU.6
1.3 Why More Speed or Parallelism?.8
1.4 Speeding Up Real Applications..10
1.5 Challenges in Parallel Programming ..12
1.6 Parallel Programming Languages and Models.12
1.7 Overarching Goals..14
1.8 Organization of the Book..15
References ..18
CHAPTER.2 Data Parallel Computing.19
2.1 Data Parallelism..20
2.2 CUDA C Program Structure.22
2.3 A Vector Addition Kernel .25
2.4 Device Global Memory and Data Transfer.27
2.5 Kernel Functions and Threading.32
2.6 Kernel Launch.37
2.7 Summary.38
Function Declarations.38
Kernel Launch.38
Built-in (Predefined) Variables .39
Run-time API..39
2.8 Exercises.39
References ..41
CHAPTER.3 Scalable Parallel Execution..43
3.1 CUDA Thread Organization.43
3.2 Mapping Threads to Multidimensional Data..47
3.3 Image Blur: A More Complex Kernel ..54
3.4 Synchronization and Transparent Scalability .58
3.5 Resource Assignment..60
3.6 Querying Device Properties..61
3.7 Thread Scheduling and Latency Tolerance.64
3.8 Summary.67
3.9 Exercises.67
CHAPTER.4 Memory and Data Locality .71
4.1 Importance of Memory Access Efficiency..72
4.2 Matrix Multiplication..73
4.3 CUDA Memory Types..77
4.4 Tiling for Reduced Memory Traffic..84
4.5 A Tiled Matrix Multiplication Kernel.90
4.6 Boundary Checks..94
4.7 Memory as a Limiting Factor to Parallelism..97
4.8 Summary.99
4.9 Exercises.100
CHAPTER.5 Performance Considerations.103
5.1 Global Memory Bandwidth..104
5.2 More on Memory Parallelism.112
5.3 Warps and SIMD Hardware..117
5.4 Dynamic Partitioning of Resources..125
5.5 Thread Granularity..127
5.6 Summary.128
5.7 Exercises.128
References ..130
CHAPTER.6 Numerical Considerations .131
6.1 Floating-Point Data Representation..132
Normalized Representation of M..132
Excess Encoding of E .133
6.2 Representable Numbers..134
6.3 Special Bit Patterns and Precision in IEEE Format..138
6.4 Arithmetic Accuracy and Rounding .139
6.5 Algorithm Considerations.140
6.6 Linear Solvers and Numerical Stability..142
6.7 Summary.146
6.8 Exercises.147
References ..147
CHAPTER.7 Parallel Patterns: Convolution .149
7.1 Background.150
7.2 1D Parallel Convolution—A Basic Algorithm .153
7.3 Constant Memory and Caching..156
7.4 Tiled 1D Convolution with Halo Cells.160
7.5 A Simpler Tiled 1D Convolution—General Caching.165
7.6 Tiled 2D Convolution with Halo Cells.166
7.7 Summary.172
7.8 Exercises.173
CHAPTER.8 Parallel Patterns: Prefix Sum..175
8.1 Background.176
8.2 A Simple Parallel Scan.177
8.3 Speed and Work Efficiency.181
8.4 A More Work-Efficient Parallel Scan.183
8.5 An Even More Work-Efficient Parallel Scan..187
8.6 Hierarchical Parallel Scan for Arbitrary-Length Inputs..189
8.7 Single-Pass Scan for Memory Access Efficiency.192
8.8 Summary.195
8.9 Exercises.195
References ..196
CHAPTER.9 Parallel Patterns Parallel Histogram Computation .. 199
9.1 Background.200
9.2 Use of Atomic Operations ..202
9.3 Block versus Interleaved Partitioning.206
9.4 Latency versus Throughput of Atomic Operations.207
9.5 Atomic Operation in Cache Memory .210
9.6 Privatization..210
9.7 Aggregation ..211
9.8 Summary.213
9.9 Exercises.213
Reference..214
CHAPTER.10 Parallel Patterns: Sparse Matrix Computation .215
10.1 Background..216
10.2 Parallel SpMV Using CSR.219
10.3 Padding and Transposition.221
10.4 Using a Hybrid Approach to Regulate Padding.224
10.5 Sorting and Partitioning for Regularization.227
10.6 Summary..229
10.7 Exercises..229
References ..230
CHAPTER.11 Parallel Patterns: Merge Sort.231
11.1 Background..231
11.2 A Sequential Merge Algorithm..233
11.3 A Parallelization Approach..234
11.4 Co-Rank Function Implementation..236
Contents
11.5 A Basic Parallel Merge Kernel ..241
11.6 A Tiled Merge Kernel..242
11.7 A Circular-Buffer Merge Kernel..249
11.8 Summary..256
11.9 Exercises..256
Reference.
作者介绍:
大卫·B. 柯克(David B. Kirk) 美国国家工程院院士,NVIDIA Fellow,曾任NVIDIA公司首席科学家。他领导了NVIDIA图形技术的开发,并且是CUDA技术的创始人之一。2002年,他荣获ACM SIGGRAPH计算机图形成就奖,以表彰其在把高性能计算机图形系统推向大众市场方面做出的杰出贡献。他拥有加州理工学院计算机科学博士学位。
胡文美(Wen-mei W. Hwu) 美国伊利诺伊大学厄巴纳-香槟分校电气与计算机工程系AMD Jerry Sanders讲席教授,并行计算研究中心首席科学家,领导IMPACT团队和CUDA卓越中心的研究工作。他在编译器设计、计算机体系结构、微体系结构和并行计算方面做出了卓越贡献,是IEEE Fellow、ACM Fellow,荣获了包括ACM SigArch Maurice Wilkes Award在内的众多奖项。他还是MulticoreWare公司的联合创始人兼CTO。他拥有加州大学伯克利分校计算机科学博士学位。
出版社信息:
暂无出版社相关信息,正在全力查找中!
书籍摘录:
暂无相关书籍摘录,正在全力查找中!
在线阅读/听书/购买/PDF下载地址:
在线阅读地址:大规模并行处理器程序设计(英文版 原书第3版)在线阅读
在线听书地址:大规模并行处理器程序设计(英文版 原书第3版)在线收听
在线购买地址:大规模并行处理器程序设计(英文版 原书第3版)在线购买
原文赏析:
暂无原文赏析,正在全力查找中!
其它内容:
书籍介绍
本书介绍并行编程和GPU架构的基本概念,详细探索了构建并行程序的各种技术,涵盖性能、浮点格式、并行模式和动态并行等主题,适合专业人士及学生阅读。书中通过案例研究展示了开发过程,从计算思维的细节着手,最终给出了高效的并行程序示例。新版更新了关于CUDA的讨论,包含CuDNN等新的库,同时将不再重要的内容移到附录中。新版还增加了关于并行模式的两个新章节,并更新了案例研究,以反映当前的行业实践。
网站评分
书籍多样性:9分
书籍信息完全性:7分
网站更新速度:9分
使用便利性:8分
书籍清晰度:7分
书籍格式兼容性:5分
是否包含广告:6分
加载速度:9分
安全性:9分
稳定性:8分
搜索功能:9分
下载便捷性:9分
下载点评
- 收费(550+)
- 值得下载(506+)
- 五星好评(528+)
- 体验差(287+)
- 种类多(412+)
- 排版满分(315+)
- 书籍多(240+)
- 内容齐全(137+)
- 体验满分(248+)
- 引人入胜(517+)
- 内涵好书(104+)
- 购买多(307+)
- 全格式(571+)
下载评价
- 网友 融***华:
下载速度还可以
- 网友 常***翠:
哈哈哈哈哈哈
- 网友 戈***玉:
特别棒
- 网友 晏***媛:
够人性化!
- 网友 田***珊:
可以就是有些书搜不到
- 网友 仰***兰:
喜欢!很棒!!超级推荐!
- 网友 濮***彤:
好棒啊!图书很全
- 网友 通***蕊:
五颗星、五颗星,大赞还觉得不错!~~
- 网友 后***之:
强烈推荐!无论下载速度还是书籍内容都没话说 真的很良心!
- 网友 郗***兰:
网站体验不错
- 网友 康***溪:
强烈推荐!!!
喜欢"大规模并行处理器程序设计(英文版 原书第3版)"的人也看了
玩转我的iCloud 刘旭 等编著 机械工业出版社【正版】 caj kindle 百度云 azw3 夸克云 下载 pdb pdf
深度管理 caj kindle 百度云 azw3 夸克云 下载 pdb pdf
有机化学实验(第3版) caj kindle 百度云 azw3 夸克云 下载 pdb pdf
王小敏的故事3:高能篇 caj kindle 百度云 azw3 夸克云 下载 pdb pdf
【预订】我们制造的垃圾(海洋环境教育绘本) 港台原版 海洋污染垃圾带 环境保护 幼儿宝宝环保科普类绘本 繁体中文版 caj kindle 百度云 azw3 夸克云 下载 pdb pdf
Collapse(ISBN=9780143117001) caj kindle 百度云 azw3 夸克云 下载 pdb pdf
返本再出发:《资本论》基本文献考辨及研究方式转换 caj kindle 百度云 azw3 夸克云 下载 pdb pdf
正版 宋太祖赵匡胤传-中华历代帝王传 古代历史名人皇帝大传 乾隆康熙顺治传读古代王朝兴衰史政治历史人物传记书籍书 caj kindle 百度云 azw3 夸克云 下载 pdb pdf
戏剧疗法 多洛丝·兰格利(Dorothy Langley) 著,游振声 译 重庆大学出版社【正版】 caj kindle 百度云 azw3 夸克云 下载 pdb pdf
我在精神病院抗抑郁 左灯著 重度抑郁症患者的抗郁过程直播 抑郁症版天才在左疯子在右 抗击抑郁症亲身经历全纪实文学 caj kindle 百度云 azw3 夸克云 下载 pdb pdf
- 电工电子技术(第4版) caj kindle 百度云 azw3 夸克云 下载 pdb pdf
- 正版一尘一刹一楼台-寺庙卷中华文明历史长卷寺庙是有形文物古代中国文化的见证具有鉴赏和研究价值中国古代 书 caj kindle 百度云 azw3 夸克云 下载 pdb pdf
- 山香3600题客观题主观题680道教师招聘考试2022教师考编用书历年真题精选题库教育理论基础教综福建湖南湖北河南山东特岗教师编制 caj kindle 百度云 azw3 夸克云 下载 pdb pdf
- 大学英语六级考试历年真题试卷与解析——无忧英语考试系列 caj kindle 百度云 azw3 夸克云 下载 pdb pdf
- 本能 昭然 花城出版社【正版】 caj kindle 百度云 azw3 夸克云 下载 pdb pdf
- 小学生迪克比 我爱暑假 caj kindle 百度云 azw3 夸克云 下载 pdb pdf
- 秦少游年谱长编全二册【放心购买 无忧售后】 caj kindle 百度云 azw3 夸克云 下载 pdb pdf
- 不死华佗【放心购买】 caj kindle 百度云 azw3 夸克云 下载 pdb pdf
- 印度诸神的世界 【德】施勒伯格 中西书局 caj kindle 百度云 azw3 夸克云 下载 pdb pdf
- 现货小猪佩奇双语故事纸板书4册 中英文版图书 0-3-4-6岁儿童翻翻书 peppa pig幼儿宝宝佩琪英语早教启蒙认知绘本我爸爸我妈妈硬壳 caj kindle 百度云 azw3 夸克云 下载 pdb pdf
书籍真实打分
故事情节:6分
人物塑造:3分
主题深度:7分
文字风格:7分
语言运用:4分
文笔流畅:5分
思想传递:6分
知识深度:4分
知识广度:4分
实用性:3分
章节划分:7分
结构布局:4分
新颖与独特:3分
情感共鸣:9分
引人入胜:4分
现实相关:6分
沉浸感:8分
事实准确性:4分
文化贡献:6分