大家好。我想问个问题。QwQ
在我的电脑上用流,想重叠内存拷贝和核函数的运算时间。但是拷贝在所有核函数都完成之后才开始,我用的函数是cudaMemcpyAsync,在别人的电脑上运行我的exe也可以成功重叠这个时间。
在我的电脑上跑成这样QwQ
然后把我的显卡插在别人的电脑上也可以正常跑,在另外一个硬件配置相同的电脑上运行也可以跑T0T我的电脑上换张卡也不能正常跑QwQ
我也尝试过换驱动TOT 反正就是我的电脑上跑不了
不知道是不是和主机的什么环境配置有关系TOT
有没有大佬可以提供一下我的排查思路
救救孩子吧 感恩QWWWWWWWQ