这个怎么满足合并访存?

hu123rong00 2013-03-08 05:13:13

按照上面图,a表示一个浮点型数组,warp每个方格表示一个线程,每种颜色代表一个线程所取的a数组两个值,这个数组下标要怎么实现才能满足合并访存啊?感觉无论怎么做都无法满足合并访存啊?还请大牛指点一下?不胜感激啊
...全文
71 1 打赏 收藏 转发到动态 举报
写回复
用AI写文章
1 条回复
切换为时间正序
请发表友善的回复…
发表回复
linxxx3 2013-03-11
  • 打赏
  • 举报
回复
现在的GPU已经加入了cache,只要跨越的范围不超过64B,对性能的影响很小。 一定想要合并访存的话,可以利用shared memory,先按合并访存的模式,把数据取到shared memory中,然后各个线程处理自己的,如果数据可以重复利用,就更合适了

579

社区成员

发帖
与我相关
我的任务
社区描述
CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。
社区管理员
  • CUDA编程社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧