unspecified launch failure 问题

full0house 2010-01-20 11:09:11
使用GXT295,有2个GPU,同样的程序,其中一个GPU运行正常,另一个GPU出现unspecified launch failure错误,请问各位高手怎么回事,错误出现在cudaMemcpy,把数据从GPU拷回CPU。
...全文
1251 17 打赏 收藏 转发到动态 举报
写回复
用AI写文章
17 条回复
切换为时间正序
请发表友善的回复…
发表回复
cuda2010 2010-04-30
  • 打赏
  • 举报
回复
14#说的也有可能,两块卡用来显示的那块卡有运行时间限制,另一块没有限制。
cuda2010 2010-04-30
  • 打赏
  • 举报
回复
295显存是独立的,可用大小上有点差别,用来显示的卡会少一点。但没听说之间有共享。
sgz007 2010-04-29
  • 打赏
  • 举报
回复
降低核函数的计算量这个问题也许就不存在了。
sgz007 2010-04-29
  • 打赏
  • 举报
回复
也许是核函数计算量过大
  • 打赏
  • 举报
回复
[Quote=引用 12 楼 openhero 的回复:]
295上应该是用交换机制 来做的,实际上 每一个的内存没那么大
[/Quote]

开勇的意思是还是通过没公开的SLI喽.实际地址空间是独立的,对吧.
OpenHero 2010-01-28
  • 打赏
  • 举报
回复
295上应该是用交换机制 来做的,实际上 每一个的内存没那么大
  • 打赏
  • 举报
回复
[Quote=引用 10 楼 openhero 的回复:]
很有可能是两个卡访问的内存出现错误了,295是共享一片内存地址
[/Quote]

?没实物尝试,肯定?在295上可以申请超过900MB的空间?
OpenHero 2010-01-27
  • 打赏
  • 举报
回复
很有可能是两个卡访问的内存出现错误了,295是共享一片内存地址
  • 打赏
  • 举报
回复
要看的.比如一个还用于显示的话,两个的资源就是不一样的.
如你确定一个正确一个不正确的话,比较可能的是由于两个卡上gmem的余量不一样.
full0house 2010-01-21
  • 打赏
  • 举报
回复
超过限制的话应该两个GPU都不可能运行得起来吧?
  • 打赏
  • 举报
回复
[Quote=引用 6 楼 full0house 的回复:]
核函数里面还包含函数的话,寄存数量是核函数里面的变量加上各函数里的变量吗?
[/Quote]

不一定,nvcc会优化,要看cubin中的实际值.
full0house 2010-01-21
  • 打赏
  • 举报
回复
如果是这样的话,按理来说两个GPU应该都会出现同样的错误.
核函数里面还包含函数的话,寄存数量是核函数里面的变量加上各函数里的变量吗?
  • 打赏
  • 举报
回复
[Quote=引用 4 楼 full0house 的回复:]
突然发现不对,是核函数没执行造成拷贝失败
请问有什么原因造成核函数不执行?
[/Quote]

有一种可能是1个block需要的寄存数或smem超过了限制.
full0house 2010-01-21
  • 打赏
  • 举报
回复
突然发现不对,是核函数没执行造成拷贝失败
请问有什么原因造成核函数不执行?
full0house 2010-01-20
  • 打赏
  • 举报
回复
一个线程对一个GPU这是肯定的。
是核函数里变量定义的问题,已经搞定。
  • 打赏
  • 举报
回复
错误在kernel启动上,这个错误信息表示kernel启动失败.
  • 打赏
  • 举报
回复
一个线程只能对应一个gpu.

231

社区成员

发帖
与我相关
我的任务
社区描述
CUDA on Windows XP
社区管理员
  • CUDA on Windows XP社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧