社区
CUDA高性能计算讨论
帖子详情
关于Cuda优化寄存器问题
杨阿毛阿
2015-04-11 07:34:37
上图为本人程序Nsight分析结果,由于寄存器个数为33,始终找不到方法将寄存器的个数降到32,已将程序中使用的中间变量全部替换,请各位大神帮忙,通过分析此程序,给予优化建议。尤其是,如何降低寄存器的使用个数。
上图显示Local memory per thread 的使用量为0,所以,我想可否将寄存器转换到LOCAL MEMEORY?已降低寄存器数量?谢谢~~
...全文
378
1
打赏
收藏
关于Cuda优化寄存器问题
上图为本人程序Nsight分析结果,由于寄存器个数为33,始终找不到方法将寄存器的个数降到32,已将程序中使用的中间变量全部替换,请各位大神帮忙,通过分析此程序,给予优化建议。尤其是,如何降低寄存器的使用个数。 上图显示Local memory per thread 的使用量为0,所以,我想可否将寄存器转换到LOCAL MEMEORY?已降低寄存器数量?谢谢~~
复制链接
扫一扫
分享
转发到动态
举报
AI
作业
写回复
配置赞助广告
用AI写文章
1 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
baodijun
2015-10-23
打赏
举报
回复
如果寄存器使用确实成为程序瓶颈。以下策略可以减少程序中寄存器的使用。 1、 拆分代码为较小的Kernel(一般需要同时修改算法才能达到比较好的效果)。 2、 运用maxrregcount编译选项控制寄存器使用。
推荐
CUDA
程序
优化
的15个策略
这是
CUDA
开发中的一些
优化
策略,相信对大家有一定的帮助
cuda
.zip_
CUDA
ustc_
cuda
_ustc
cuda
ustc
cuda
作业 。源码。字数 字数 字数。
cuda
安装与使用
cuda
博客
cuda
入门资料
里面有四个文件 包括
cuda
的安装 在windows下的使用 使用经验
cuda
博客 学习
cuda
的入门好资料
cuda
编程指南 3.0
cuda
编程指南
cuda
编程指南
cuda
编程指南 3.0
CUDA
参考手册
CUDA
CUDA
参考手册,目录是英文的内容是中文的
CUDA高性能计算讨论
357
社区成员
615
社区内容
发帖
与我相关
我的任务
CUDA高性能计算讨论
CUDA高性能计算讨论
复制链接
扫一扫
分享
社区描述
CUDA高性能计算讨论
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章