关于Cuda优化寄存器问题

杨阿毛阿 2015-04-11 07:34:37

上图为本人程序Nsight分析结果,由于寄存器个数为33,始终找不到方法将寄存器的个数降到32,已将程序中使用的中间变量全部替换,请各位大神帮忙,通过分析此程序,给予优化建议。尤其是,如何降低寄存器的使用个数。

上图显示Local memory per thread 的使用量为0,所以,我想可否将寄存器转换到LOCAL MEMEORY?已降低寄存器数量?谢谢~~
...全文
341 1 打赏 收藏 转发到动态 举报
写回复
用AI写文章
1 条回复
切换为时间正序
请发表友善的回复…
发表回复
baodijun 2015-10-23
  • 打赏
  • 举报
回复
如果寄存器使用确实成为程序瓶颈。以下策略可以减少程序中寄存器的使用。 1、 拆分代码为较小的Kernel(一般需要同时修改算法才能达到比较好的效果)。 2、 运用maxrregcount编译选项控制寄存器使用。

353

社区成员

发帖
与我相关
我的任务
社区描述
CUDA高性能计算讨论
社区管理员
  • CUDA高性能计算讨论社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧