cuda流并行求助贴

qq_43154002 2025-03-05 17:53:31

我的核函数数据量比较小,占不满4090的计算资源,而且还需要对计算结果进行回传,要进行很多次。

我使用流进行核函数并行,让数据计算与传输同时进行达到隐藏延迟的目的。

因本人比较菜,遇到如图问题,一开始并行的很好,但是为什么后半段效果就完全没有呢。而且从最上方蓝条看计算资源也没有占满(不知道那个是不是这个意思,猜的)

求大佬指点

 

 

...全文
37 回复 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

589

社区成员

发帖
与我相关
我的任务
社区描述
CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。
社区管理员
  • CUDA编程社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧