急问一个问题

baniasthbird 2010-11-21 06:37:36
GPU高性能计算中有这个公式
threadsPerGrid=(N+threadsPerBlock-1)/threadsPerBlock
这个到底是怎么推出来的啊?
...全文
84 4 打赏 收藏 转发到动态 举报
写回复
用AI写文章
4 条回复
切换为时间正序
请发表友善的回复…
发表回复
baniasthbird 2013-03-05
  • 打赏
  • 举报
回复
谢谢大家,不好意思这么晚才结帖
zy020118 2010-12-21
  • 打赏
  • 举报
回复
N是实际的线程数量,threadsPerBlock是每个Block中的线程数量,
/是整除,结果threadsPerGrid是Grid中Block的数量,这个变量命名有问题。

因为Block只能多,不能少,所以才要这么算。

就如楼上的
保证threadsPerGrid*threadsPerBlock>=N.
zy020118 2010-12-21
  • 打赏
  • 举报
回复
[Quote=引用 1 楼 l7331014 的回复:]

保证threadsPerGrid*threadsPerBlock>=N.

[/Quote]
  • 打赏
  • 举报
回复
保证threadsPerGrid*threadsPerBlock>=N.
C的除法是截尾的.

581

社区成员

发帖
与我相关
我的任务
社区描述
CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。
社区管理员
  • CUDA编程社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧