常量内存问题

_梦魇花葬 2014-06-26 10:29:23
加精
问题如下:
有一个大小为16KB的数据结构,每个线程块以随机的方式对其访问,但每个线程束都以统一的方式对其访问。该数据结构最好用寄存器、常量内存还是共享内存进行保存,为什么?
这是本人在做课题的时候遇到的一个问题,进过查询资料,得到问题的答案,感觉问题还是跟实际的GPU有很大的联系,也是GPU程序优化的一个方面,即数据存储的问题,所以想跟大家分享。
本人将在周五的晚上公布答案和讲解原理,在此之前,希望大家积极参与讨论,并有积分奖励哦~~
...全文
774 23 打赏 收藏 转发到动态 举报
写回复
用AI写文章
23 条回复
切换为时间正序
请发表友善的回复…
发表回复
xia8710279 2014-07-06
  • 打赏
  • 举报
回复
引用 楼主 sparrow986831 的回复:
问题如下: 有一个大小为16KB的数据结构,每个线程块以随机的方式对其访问,但每个线程束都以统一的方式对其访问。该数据结构最好用寄存器、常量内存还是共享内存进行保存,为什么? 这是本人在做课题的时候遇到的一个问题,进过查询资料,得到问题的答案,感觉问题还是跟实际的GPU有很大的联系,也是GPU程序优化的一个方面,即数据存储的问题,所以想跟大家分享。 本人将在周五的晚上公布答案和讲解原理,在此之前,希望大家积极参与讨论,并有积分奖励哦~~
学习
Vampire__lord 2014-07-04
  • 打赏
  • 举报
回复
看不懂的说
jingli_z 2014-07-02
  • 打赏
  • 举报
回复
看到了,感谢LZ!
lwg255 2014-07-02
  • 打赏
  • 举报
回复
了解了解 。。。。。。。。。。
^8^ 2014-06-30
  • 打赏
  • 举报
回复
看到了啊。。。。
lhw7791086 2014-06-30
  • 打赏
  • 举报
回复
卖水果的net 2014-06-28
  • 打赏
  • 举报
回复
LZ 的答案和原理呢?
卖水果的net 2014-06-28
  • 打赏
  • 举报
回复
引用 15 楼 sparrow986831 的回复:
[quote=引用 13 楼 wmxcn2000 的回复:] LZ 的答案和原理呢?
http://bbs.csdn.net/topics/390822619[/quote] 看到了,感谢LZ!
_梦魇花葬 2014-06-28
  • 打赏
  • 举报
回复
引用 13 楼 wmxcn2000 的回复:
LZ 的答案和原理呢?
http://bbs.csdn.net/topics/390822619
我是2b蛋蛋 2014-06-27
  • 打赏
  • 举报
回复
引用 1 楼 cattpon 的回复:
很高深的样子~
fy_20080 2014-06-27
  • 打赏
  • 举报
回复
学习中!
wyscw2014 2014-06-27
  • 打赏
  • 举报
回复
学习一下,求解答。
梦竹 2014-06-27
  • 打赏
  • 举报
回复
果断共享内存,记得添加写保护
腹黑的大象 2014-06-27
  • 打赏
  • 举报
回复
学习学习一下
GW786228836 2014-06-27
  • 打赏
  • 举报
回复
学习
hugh_z 2014-06-27
  • 打赏
  • 举报
回复
learning
qwer_boo 2014-06-27
  • 打赏
  • 举报
回复
相当高端的样子~求解答~
zyjj_99 2014-06-27
  • 打赏
  • 举报
回复
等待楼主答疑解惑
卖水果的net 2014-06-27
  • 打赏
  • 举报
回复
1. "以随机的方式对其访问" 似乎表明 ,使用 常量不合适,多个线程有可能修改其中的值。 2. 寄存器,也不大合适,寄存器的大小一共也没多少,这么紧张的资源,你一下子就要 16K ,以后还可能是64K 、1024K ,养不起呀,养不起。。 3. 共享内存,就剩这一个了。。。 就他吧。 4. 呵呵,个人拙见,欢迎批评!
cattpon 2014-06-27
  • 打赏
  • 举报
回复
很高深的样子~
加载更多回复(1)

579

社区成员

发帖
与我相关
我的任务
社区描述
CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。
社区管理员
  • CUDA编程社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧