要如何提高CUDA内核运行速度?

QiuHan_Ahha 2023-11-27 17:12:45

我的内核函数执行较慢,于是我想通过调试来判断是什么因素影响了CUDA内核的执行速度。

我从后向前不停地注释代码,然后反复测试执行时间,发现当代码注释到某一段后,其整体运算时间突然由25s降低到了9s。然后发生跳变的那条注释代码是一条非常普通的运算,不像是会影响如此巨大。

请问还有哪些可能导致以上突然降速情况,是否是高速缓存不够用了?

...全文
460 1 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
1 条回复
切换为时间正序
请发表友善的回复…
发表回复
GKatHere 2024-10-29
  • 打赏
  • 举报
回复

是分支吗?

589

社区成员

发帖
与我相关
我的任务
社区描述
CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。
社区管理员
  • CUDA编程社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧