cuda 中 printf 不能显示在屏幕

一百元 2015-04-19 09:47:48
#include <stdio.h>

__global__ void childKernel()
{
printf("Hello ");
}

__global__ void parentKernel()
{
// launch child
childKernel<<<1,1>>>();
if (cudaSuccess != cudaGetLastError()) {
return;
}

// wait for child to complete
if (cudaSuccess != cudaDeviceSynchronize()) {
return;
}

printf("World!\n");
}

int main(int argc, char *argv[])
{
// launch parent
parentKernel<<<1,1>>>();
if (cudaSuccess != cudaGetLastError()) {
return 1;
}

// wait for parent to complete
if (cudaSuccess != cudaDeviceSynchronize()) {
return 2;
}

return 0;
}
This program may be built in a single step from the command line as follows:

$ nvcc -arch=sm_35 -rdc=true hello_world.cu -o hello -lcudadevrt


Read more at: http://docs.nvidia.com/cuda/cuda-c-programming-guide/index.html#ixzz3XlLde1G5
Follow us: @GPUComputing on Twitter | NVIDIA on Facebook

如上所示,按照上面编译通过,但是不能显示在屏幕,不知哪位大牛帮忙解答一下,小弟初学cuda
...全文
2580 3 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
3 条回复
切换为时间正序
请发表友善的回复…
发表回复
fallening 2015-05-01
  • 打赏
  • 举报
回复
这是 dynamic parallel,不该这么编译,而且要检查你的显卡是否支持 dynamic parallel 这个特性,也就是支持到 3.5 编译要分两步 nvcc x.cu -o _x.o -m64 -dc -gencode arch=compute_35,code=sm_35 --relocatable-device-code true -O2 -Xptxas -v nvcc -dlink _x.o -arch=sm_35 -o x.o -m64 -rdc=true -O2 -Xptxas -v 最后是链接 nvcc -o x x.o _x.o -lcudadevrt -lcudart -m64 如果你的显卡支持到 3.5,那么就可以运行 ./x 了。
fallening 2015-05-01
  • 打赏
  • 举报
回复
这是 dynamic parallel,不该这么编译,而且要检查你的显卡是否支持 dynamic parallel 这个特性,也就是支持到 3.5 编译要分两步 nvcc x.cu -o _x.o -m64 -dc -gencode arch=compute_35,code=sm_35 --relocatable-device-code true -O2 -Xptxas -v nvcc -dlink _x.o -arch=sm_35 -o x.o -m64 -rdc=true -O2 -Xptxas -v 最后是链接 nvcc -o x x.o _x.o -lcudadevrt -lcudart -m64 如果你的显卡支持到 3.5,那么就可以运行 ./x 了。
feixiangyundjf 2015-04-30
  • 打赏
  • 举报
回复
请问你的问题解决了吗?我也遇到了同样的问题

2,408

社区成员

发帖
与我相关
我的任务
社区描述
高性能计算
社区管理员
  • 高性能计算社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧