博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
《CUDA C编程权威指南》——第3章CUDA执行模型
阅读量:5960 次
发布时间:2019-06-19

本文共 341 字,大约阅读时间需要 1 分钟。

本节书摘来自华章社区《CUDA C编程权威指南》一书中的第3章CUDA执行模型,作者[美] 马克斯·格罗斯曼(Max Grossman) ,更多章节内容可以访问云栖社区“华章社区”公众号查看

第3章

CUDA执行模型
本章内容:
通过配置文件驱动的方法优化内核
理解线程束执行的本质
增大GPU的并行性
掌握网格和线程块的启发式配置
学习多种CUDA的性能指标和事件
了解动态并行与嵌套执行
通过上一章的练习,你已经学会了如何在网格和线程块中组织线程以获得最佳的性能。尽管可以通过反复试验找到最佳的执行配置,但你可能仍然会感到疑惑,为什么选择这样的执行配置会更好。你可能想知道是否有一些选择网格和块配置的准则。本章将会回答这些问题,并从硬件方面深入介绍内核启动配置和性能分析的信息。

转载地址:http://teyax.baihongyu.com/

你可能感兴趣的文章
在线匿名之父意欲终结“加密战争”
查看>>
WLAN市场销量逐步逼近有线网络
查看>>
SDN市场或许进入了慢热期
查看>>
教你使用Linux系统的Shell脚本维护Oracle
查看>>
力龙信息布局大数据领域
查看>>
大数据巧治职业差评师 生存空间锐减九成
查看>>
天津开展免费无线局域网建设
查看>>
朝鲜最新消息|今天勒索病毒跟朝鲜黑客有关
查看>>
提高信息安全意识对网络勒索病毒说不
查看>>
英国政府可能利用曼彻斯特自杀袭击要求互联网公司破解加密
查看>>
Mozilla 将大幅简化火狐浏览器的同步操作
查看>>
微软加大在 Edge/IE 浏览器上阻止 SHA-1 证书的力度
查看>>
龙芯将两款 CPU 核开源,这意味着什么?
查看>>
《51单片机应用开发从入门到精通》——导读
查看>>
PostgreSQL 锁解密
查看>>
snoopy 模拟表单提交(1)
查看>>
从软件技术演变到软件项目管理的进步
查看>>
云数据库与传统数据库有什么区别
查看>>
【Python之旅】第七篇(二):Redis使用基础
查看>>
编译可在Android上运行的依赖库(四):llibiconv库
查看>>