CUDA返回值始终是0
代码如下:
#include <iostream>
__global__ void add(int a, int b, int *c){
*c = a + b;
}
int main(void){
int c = 1;
int *dev_c;
cudaMalloc((void**)&dev_c, sizeof(int));
add<<<1,1>>>(2, 7, dev_c);
cudaMemcpy(&c, dev_c, sizeof(int), cudaMemcpyDeviceToHost);
printf("2+7=%d\n", c);
cudaFree(dev_c);
return 0;
}
编译指令为:
nvcc -c test.cu -o test.obj
nvcc test.obj -o test.exe
编译没有错误,test.exe也可以运行,但是输出结果始终为
2+7=0
实在是太奇怪了,不知道怎么解决,其他程序也是一样,结果都是0
cuda版本11.1
希望有大神指点