cudaMemcpy()慢,十分慢

gong_xufei 2011-05-06 12:07:00
我的程序中使用cudaMemcpy()从device上往host上传数据的时候出现了个很奇怪的现象--慢,无比地慢,并且---

我试过,即便是传1Byte,也要花费几十分钟

但是,如果cudaMemcpy(dst,src,0,cudaMemcpyDeviceToHost) ,瞬间完成

不理解,1Byte有什么好传的?这是为什么?

哪位大侠能解释一下?
...全文
403 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

580

社区成员

发帖
与我相关
我的任务
社区描述
CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。
社区管理员
  • CUDA编程社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧