问题如下: 有一个大小为16KB的数据结构,每个线程块以随机的方式对其访问,但每个线程束都以统一的方式对其访问。该数据结构最好用寄存器、常量内存还是共享内存进行保存,为什么? 这是本人在做课题的时候遇到的一个问题,进过查询资料,得到问题的答案,感觉问题还是跟实际的GPU有很大的联系,也是GPU程序优化的一个方面,即数据存储的问题,所以想跟大家分享。 本人将在周五的晚上公布答案和讲解原理,在此之前,希望大家积极参与讨论,并有积分奖励哦~~
[quote=引用 13 楼 wmxcn2000 的回复:] LZ 的答案和原理呢?
LZ 的答案和原理呢?
很高深的样子~
579
社区成员
2,918
社区内容
加载中
试试用AI创作助手写篇文章吧