profiler心得

luren999 2010-05-14 09:10:45
cuda visual profiler的一些心得吧,譬如运行结果数据中哪些数据会对程序性能有比较大的影响,如何对代码作相应的优化等, 希望各位不惜赐教......
...全文
857 7 打赏 收藏 转发到动态 举报
写回复
用AI写文章
7 条回复
切换为时间正序
请发表友善的回复…
发表回复
likaide2008 2012-07-17
  • 打赏
  • 举报
回复
linux平台运行profiler,但是输出的参数没有gld uncoalesced,请问大侠如何解决
tllovejf99 2011-05-15
  • 打赏
  • 举报
回复
求指教:session setting中选不上gld uncoalesced,选择正方形框界面是灰色的。我用的版本是2.3
rolyluo 2010-05-20
  • 打赏
  • 举报
回复
关于profiler,问下一些重要参数值究竟范围多少是偏大,多少又是偏小呢?
只给出一个数值,没法判断是否应该对它优化啊

譬如:
branch 5480
gld coalesced 3840
gst coalesced 2560
是大?小?

再问一个,如果没有uncoalesced地读写,是不是即使session setting选上了gld uncoalesced,结果也不会显示这个的数值?

warp serialize也是选上了不显示的?
  • 打赏
  • 举报
回复
[Quote=引用 3 楼 rolyluo 的回复:]
还有summary table中instruction throughput的值多大合适?
譬如0.519953是怎样?
[/Quote]

我的理解是计算密集还是带宽优先的指标....
上面的值的话,优化gmem访问更重要吧...呵呵.
  • 打赏
  • 举报
回复
[Quote=引用 2 楼 rolyluo 的回复:]
关于profiler,问下一些重要参数值究竟范围多少是偏大,多少又是偏小呢?
只给出一个数值,没法判断是否应该对它优化啊
branch 5480
gld coalesced 3840
gst coalesced 2560
[/Quote]

值没多大意义的,一般不大管.

[Quote=引用 2 楼 rolyluo 的回复:]
再问一个,如果没有uncoalesced地读写,是不是即使session setting选上了gld uncoalesced,结果也不会显示这个的数值?

[/Quote]
全0的话,是的.
warp serialize 也一样.

以上的省略在output窗口中都该有提示的.
rolyluo 2010-05-20
  • 打赏
  • 举报
回复
还有summary table中instruction throughput的值多大合适?
譬如0.519953是怎样?
  • 打赏
  • 举报
回复
<<编程手册>>......

231

社区成员

发帖
与我相关
我的任务
社区描述
CUDA on Windows XP
社区管理员
  • CUDA on Windows XP社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧