博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
《CUDA高性能并行计算》----0.9 历史沿革
阅读量:6853 次
发布时间:2019-06-26

本文共 1179 字,大约阅读时间需要 3 分钟。

本 节 书 摘 来 自 华 章 出 版 社 《CUDA高性能并行计算》 一 书 中 的 第0章,第0.9节, 作 者 CUDA for Engineers: An Introduction to High-Performance Parallel Computing[美] 杜安·斯托尔蒂(Duane Storti)梅特·尤尔托卢(Mete Yurtoglu) 著,苏统华 项文成 李松泽 姚宇鹏 孙博文 译 , 更 多 章 节 内 容 可 以 访 问 云 栖 社 区 “华 章 计 算 机” 公 众 号 查 看。

0.9 历史沿革

本书是作者在CUDA疆域探险数年的经验总结。最初开展的是容积医学影像(volumetric medical imaging)、2D和3D成像(即透视和CT扫描)的配准以及计算机辅助设计(computer-aided design)和增材制造(additive manufacturing)的新方法研究。随着CUDA的效用和重要性变得愈加明显,分享对CUDA的欣赏和经验无疑是非常正确的。我们创建了一门专题性的CUDA应用课程,课程面向专业分布很广泛的学生,只需他们具备基本的计算经验即可。本书的写作是在三次课程讲授基础上进行的,课程历经完善,已发展到包括系统配置、CUDA样例、C语言编程基础速成、CUDA的并行化模型(同时包含了实现它们所需的超出C语言基础知识之外的东西),另外对一些实用的CUDA特性予以全面讲解,包括原子功能、共享内存和交互式图形学。所有这些内容都安排在为期10周一个学期的前半部分,其余时间专供项目实践和学生演示之用。每个学生在第5周进行项目选题的演讲,在最后的第10周,对所做项目进行展示。在两者之间的课上,安排为答疑时间和(教师或客座专家)分享创建和使用CUDA应用的经验。与本书的逻辑结构对应,课程的执行流程大致如下:

系统配置和初始CUDA样例运行:附录A、附录B和第1章。

C语言基础:附录C。

CUDA基础,包括并行模型和关键语言扩展:第2章和第3章。

交互式图形学:第4章。

共享内存:第5章的第一部分。

原子功能:第6章的第一部分。

项目:让学生自由探索剩下的第5~9章,寻找项目实践的灵感,鼓励他们积极编写代码,并尽可能多地帮助他们去克服其中碰到的障碍。

虽然本书的组织跟课程有一定的关系,但涉及的内容大多是无向导的CUDA世界,如此偌大的疆域,很难不迷路。我们搜集并查阅了很多材料,包括书籍、示例代码、研究类论文、研讨会讲座,以精选出学习CUDA必需的那些知识,能够让外行工程师也知道利用如CUDA这样的强大工具能做什么以及如何做到。我们真诚希望,本书可以同时支持个人学习和课堂配套教学;我们真诚地希望本书能帮助你避开拦路虎,让你的CUDA之旅更高效、更愉快、更有收获。

参考文献

8a1d5177ef95b61ea79fbdee61a03a2df356c89c

转载地址:http://dqfyl.baihongyu.com/

你可能感兴趣的文章
不要为数据持久层编写单元测试
查看>>
使用Mycat实现MySQL数据库的读写分离
查看>>
linux安装软件命令
查看>>
在centos 6 下安装mysql 5.6
查看>>
我的友情链接
查看>>
我的友情链接
查看>>
Linux集群服务知识点总结及通过案例介绍如何实现高性能web服务
查看>>
linux 运维从初级到高级的修炼
查看>>
关于Hadoop系列文章
查看>>
JAVA学习日志(7-3-抽象类)
查看>>
Linux date命令的用法(转)
查看>>
Linux shell 之 提取文件名和目录名的一些方法
查看>>
test.
查看>>
树莓派3B连接WIFI
查看>>
springMVC启动过程源码解析(一)
查看>>
linux中生成考核用的FAT32文件系统结构样例(一)
查看>>
Docker 常用命令
查看>>
eclipse快捷键
查看>>
纯虚函数和虚函数的区别
查看>>
配置adb环境变量
查看>>