还是那个问题

hu123rong00 2013-03-13 01:21:25

类似于DIT-FFT运算,这里只是取用了8个点,假设用N来表示点数,用L来表示级数每种颜色代表一个线程,比如在第一层,每个线程取的两个数间距为1(2的L-1次方),读取两个数计算后写回原位,第一级完成后第二级,每个线程取的两个数间隔为2(2的L-1次方),读取两个数计算后写回原位,以此类推,一直到L(L=logN)级。
1.如果用shared memory分段读取,就在级数(L)较高时,这两个数据之间跨较大,没能在一个段中,所以不能读写。
2.只有最后一级是显然满足合并访存的,但是其他级要怎么实现合并访存啊?
...全文
39 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

579

社区成员

发帖
与我相关
我的任务
社区描述
CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。
社区管理员
  • CUDA编程社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧