我的内核函数执行较慢,于是我想通过调试来判断是什么因素影响了CUDA内核的执行速度。
我从后向前不停地注释代码,然后反复测试执行时间,发现当代码注释到某一段后,其整体运算时间突然由25s降低到了9s。然后发生跳变的那条注释代码是一条非常普通的运算,不像是会影响如此巨大。
请问还有哪些可能导致以上突然降速情况,是否是高速缓存不够用了?
是分支吗?
589
社区成员
2,924
社区内容
加载中
试试用AI创作助手写篇文章吧