对于n卡 有没有工具可以分析我的opencl程序的利用率

youxia000 2013-11-07 05:29:07
学了几个月的opencl,也编写出了kernel,amd提供了个codex在vs2010里的插件可以看看gpu的利用率等等信息,想问下n卡有没有类似的,
或者说n卡怎么来优化呢


用opencl是想优化原来cpu版本的光线投射算法,移植之后的gpu速度提升不是特别理想,用codex分析才利用了10%的计算能力,调了下可以用到个50%,请教下高手对gpu的优化有哪些指导性意见

拜谢。
...全文
887 6 打赏 收藏 转发到动态 举报
写回复
用AI写文章
6 条回复
切换为时间正序
请发表友善的回复…
发表回复
longshen_ljj 2016-03-24
  • 打赏
  • 举报
回复
问下楼主研究的怎么样了,visual profiler能不能分析opencl程序?最近同样被N卡opencl程序分析搞的很蛋疼
youxia000 2013-11-24
  • 打赏
  • 举报
回复
好 我试试减少vector的计算,感谢版主 lcwyylcwyy。结贴吧 。免的忘记了
lcwyylcwyy 2013-11-18
  • 打赏
  • 举报
回复
N卡和A在最小并行粒度上是不同,而且其local存储器的可用空间好像也不一样
outstander 2013-11-18
  • 打赏
  • 举报
回复
从这个图来看,主要是因为vector寄存器使用过多,可尝试减少vector运算来进一步加速。
youxia000 2013-11-15
  • 打赏
  • 举报
回复


感谢关注 这是codexl给出的结果,我加上了个__attribute__((reqd_work_group_size(128, 8, 1))) 对a卡从10%提升到50% 但是n卡加上之后运行到clEnqueueNDRangeKernel报出-54 CL_INVALID_WORK_GROUP_SIZE的错误。不理解为什么。


我研究下cuda的profile。
outstander 2013-11-14
  • 打赏
  • 举报
回复
请贴出性能分析结果,否则很难给出意见。 印象中,cuda的profile不仅能给出cuda的分析也能分析opencl的,用法一样用profile运行即可。楼主可以试试

602

社区成员

发帖
与我相关
我的任务
社区描述
异构开发技术
社区管理员
  • OpenCL和异构编程社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧