cubin文件里的bar是指什么

full0house 2010-03-03 04:16:27
差不多的两个核函数,一个bar为1,一个为0,这个值指什么?

CUDA里面有没相关的文档?
...全文
63 6 打赏 收藏 转发到动态 举报
写回复
用AI写文章
6 条回复
切换为时间正序
请发表友善的回复…
发表回复
full0house 2010-03-04
  • 打赏
  • 举报
回复
把两个global都删成只有相同的一个device函数,慢的lmen大小差不多是快的两倍
例如
__global__ fun1()
{
cal();
}
__global__ fun2()
{
cal();
}
为什么这样lmen都会不同?
full0house 2010-03-04
  • 打赏
  • 举报
回复
看了下它们的CUBIN文件,慢的那个lmem要比快的大,但是我把慢的那个数据定义都删除,只剩下device函数,还是会比快的那个大,不知道NVCC是怎么处理的.
full0house 2010-03-04
  • 打赏
  • 举报
回复
device函数是完全相同的,执行步骤也是一样的.
  • 打赏
  • 举报
回复
看device函数中是否有判断.而且是根据值来转移的判断.if是很费时间的.
full0house 2010-03-03
  • 打赏
  • 举报
回复

再问你个问题,我测试两个__global__,它们调用同一个__device__函数,只有__global__中一点点数据准备的不同,但是速度却差两倍以上,时间主要花在__device__函数,不知道为什么差这么多
  • 打赏
  • 举报
回复
应该是同步指令数吧.

231

社区成员

发帖
与我相关
我的任务
社区描述
CUDA on Windows XP
社区管理员
  • CUDA on Windows XP社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧